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1. Мотивация работы 

Проведение исследований, движимых данными, становится неотъемлемой частью 
различных областей науки, экономики, бизнеса (далее - областей с интенсивным использованием 
данных - ОИИД). Данные превращаются в стратегический ресурс практически во всех ОИИД, 
затрагивающий все сферы деятельности людей и определяющий конкурентоспособность, уровень 
развития науки, промышленности, здравоохранения, обороноспособности страны. Одной из 
важнейших проблем сохранения и повышения уровня научных исследований в России является 
обеспечение возможности эффективного доступа исследовательских организаций России к 
данным, накапливаемым в мире. 

Целью настоящего обзора является анализ существующих и планируемых в мире 
глобальных инфраструктур обеспечения данными многопрофильных (тиІШізсірІіпагу) областей 
исследований с интенсивным использованием данных для последующих решений по созданию 
инфраструктуры совместного доступа к данным, накопленным за рубежом и в России в таких 
областях. 














В подготовке настоящего обзора принимали участие научные сотрудники из ряда 
организаций РАН, включая Институт проблем информатики Федерального исследовательского 
центра «Информатика и управление» РАН (ИПИ ФИЦ ИУ РАН), Институт космических исследований 
РАН (ИКИ РАН), Институт металлургии и материаловедения РАН (ИМЕТ РАН), Институт мониторинга 
климатических и экологических систем СО РАН (ИМКЭС СО РАН), Институт астрономии РАН 
(ИНАСАН РАН), Научный центр неврологии РАМН (НЦН РАМН), Институт оптики атмосферы СО 
РАН (ИОА СО РАН). Одним из результатов совместной работы групп перечисленных организаций 
была публикация [1], посвященная анализу проблемы доступа к данным в исследованиях с 
интенсивным использованием данных в России. Настоящая работа поддержана грантом РФФИ 16- 
07-01028. 

2. Открытая наука и планы ее организации в Европе 

Наука изменяется под действием стремительного развития информационных и 
коммуникационных технологий, которые за удивительно короткий промежуток времени 
произвели в научных методах настоящую революцию. Сейчас научно-исследовательские 
инфраструктуры предлагают учёным беспрецедентные возможности доступа к источникам данных, 
уникальным установкам, движимых интенсивным использованием данных, а также постоянно 
улучшающимся средствам анализа и симуляции. Исследовательские сервисы, процессы и 
результаты становятся доступными для всех слоёв общества. Генерируются громадные объёмы 
данных, принося новые необычные возможности инновационного повторного использования их в 
новых научных, коммерческих контекстах, включая также контексты гражданской науки. Это - 
Открытая наука. Открытая наука — это ключевой движитель не только научного прогресса, но и 
экономических и социальных инноваций. Основные особенности Открытой науки можно кратко 
охарактеризовать так: 

• Открытая наука ставит своей целью преобразовать научный процесс с помощью ІСТ 
инструментов, сетей и средств связи, чтобы исследования стали более открытыми, 
глобальными, совместными, творческими и приближенными к обществу. 

• Открытая наука занимается вопросами, как исследования проводятся, распространяются, 
организуются и трансформируются цифровыми методами, сетями и средствами связи. Она 
полагается на объединённый эффект технологического развития и культурных перемен в 
сторону коллаборации и открытости исследований. 

• Открытая наука делает научные процессы более эффективными, прозрачными и 
эффективными вводя новые инструменты для научной коллаборации, экспериментов и 
анализа и делая научные знания более доступными. 

• Открытая наука — это ключевой шаг в направлении нового пути открытий, совместного 
использования и сохранения Знаний. 


Три хорошо известных ключевых компонента в развитии Открытой науки включают: 

1) Открытый доступ к исследовательским публикациям, обеспечивающий прямое их 
использование, без каких-либо ограничений, регистраций или подписок. 

2) Улучшенное управление исследовательскими данными, покрывающее полный цикл 
обработки данных, от планирования, сбора и курирования данных до публикации, включения их в 
анализ и сохранение. 


3) Улучшенные е-инфраструктуры позволяют обрабатывать большие коллекции данных, 
извлекать информацию из научных баз данных и литературы, а также обеспечивает 
распределённое взаимодействие исследователей на всех уровнях, включая вклад от гражданской 
науки. 


В рамках рамочной программы ЕвроСоюза Н0ВІ20М 2020 с 2017 г. Еврокомиссией введено 
требование, чтобы доступ к публикациям всех проектов этой программы стал открытым, а данные 
также стали открытыми и доступными. В июле 2016 г. Еврокомиссия опубликовала руководство [2]. 
Этот документ связан с пилотным проектом Ореп ВезеагсГі 0а1;а Рііоі [3], целью которого является 
улучшение и максимизация доступа и повторного использования исследовательских данных, 
генерируемых в проектах Н0ВІ20М 2020, а также установление баланса между открытостью и 
защитой научной информации, коммерциализацией и правами интеллектуальной собственности, 
соображениями приватности, безопасности, наряду с изучением вопросов управления данными и 
их сохранения. 

Другим проектом, связанным с повышением эффективности повторного использования 
данных, образуемых в рамках проектов программы НОВІ20М 2020, является Ше ОрепАІВЕ 2020 
Ргоіесі;, поддерживаемый Еврокомиссией. В этом проекте, выполняемом 50 организациями 
Евросоюза и за его пределами, развивается крупномасштабная инициатива продвижения Открытой 
науки в направлении повышения эффективности обнаружения и повторного использования 
публикаций и данных - результатов исследований. Результатом проекта станут потоки работ и 
сервисы над ценным контентом, содержащим результаты исследований, поддерживающие 
интероперабельную сеть репозиториев на основании общих руководств. 

3. Сводка результатов анализа ситуации в России после 2020 года 

Целью исследования [1] явился анализ глобальных тенденций создания массивных 
коллекций данных в мире и обеспечения возможности совместного использования таких 
коллекций при решении задач исследования и принятия решений в различных ОИИД в России. 
Конкретный набор ОИИД, отобранных для анализа, включал астрономию, материаловедение, 
науки о Земле, геномику и протеомику, нейронауку. По каждой из рассмотренных ОИИД 
представлены крупные стратегические инициативы США и Европейского Союза (ЕС), примеры 
крупных коллекций данных в мире до 2025г., известные проекты информационных и 
телекоммуникационных инфраструктур и центров данных, в том числе: 

• Астрономия (большой обзорный телескоп І.55Т, массив квадратного километра (Бциаге 
Кііотеіег Аггау, 5КА) — наиболее амбициозный проект в радиоастрономии, планируемый 
Е50 к пуску в 2024 г. гигантский телескоп Е-ЕІ.Т (с диаметром главного зеркала 39 м), 
космическая обсерватория Гайя, глубоководный нейтринный телескоп КМЗМеТ, детекторы 
гравитационных волн, а также публичные коллекции данных, которые используются в России 
и требуют улучшения доступа к данным). 

• Материаловедение (данные, получаемые в рамках Стратегической инициативы США по 
Геному Материалов (М6І), коллекции данных в Европе (например, 5ТІ\І, 5ргіп§ег Маіегіаіз), в 
США (данные N151), в Японии (данные в Национальном институте материаловедения)). 

• Геномика и протеомика (данные, получаемые при помощи 7400 высокопроизводительных 
геномных секвенаторов в мире (из них в России находится всего 14 секвенаторов), коллекции 
геномных данных (данные накапливаются в таких проектах как «1001 геном», «Геном 10К», 
«Человеческий микробном», «Атлас генома рака»), атлас протеом человека, развиваемый в 
Швеции, интегрированное хранилище данных протеомики в Европе, данные проекта 


Европейской молекулярной биологической обсерватории ЕЫХІВ, данные Европейского 
проекта ЕЮ2К (от больших биомедицинских данных к знаниям). 

• Нейронаука (данные стратегических проектов исследования мозга человека - Европейского 
(НВР) и проекта США (ВВАІІМ), данные коннектома мозга человека (проект НСР), атласы мозга, 
совмещающие геномику и нейроанатомию). 

• Науки о Земле (данные, получаемые в рамках большого числа проектов в разных странах, в 
том числе в рамках космических программ в Европе (Сорегпісиз, 30 спутников), в США 
(программы Е05, Е05РІ5), глобальной системы СЕ055, проекта Оа^аОЫЕ в США для 
поддержки совместного использования данных, накапливаемых в многочисленных 
репозиториях в федеральных сетях, и ряда других проектов, в том числе 
специализирующихся в области климата Земли. 

Всюду, где в этом перечне упоминаются «данные», следует читать «данные и сервисы». В 
[1] приведены также примеры коллекций данных в названных областях, накопленных в России. В 
результате анализа планов по созданию крупных коллекций данных в мире в [1] сделаны 
следующие выводы. 

Для достижения эффективного доступа исследовательских организаций России к данным, 
накапливаемым в мире, с целью их совместного использования с российскими данными в 
исследовательских проектах России, представляется целесообразной организация целевой 
междисциплинарной программы для реализации пилотного проекта распределенной 
инфраструктуры для накопления и анализа данных, совместимой с зарубежными открытыми 
инфраструктурами в науке. 

Одной из первостепенных задач такой программы является анализ и выбор вариантов 
инфраструктур и платформ для поддержки решения задач анализа больших данных в различных 
ОИИД, а также для обеспечения доступа исследователей к разнообразным видам данных в мире и 
совместного междисциплинарного их использования. Настоящий проект является шагом в этом 
направлении. 

Включенный в [1] набор массивных коллекций данных, планируемых к получению в мире, 
предлагается использовать в качестве ориентира при планировании и развитии исследовательских 
инфраструктур для накопления и анализа данных, совместимых с зарубежными открытыми 
инфраструктурами в науке. Рассматриваемые в [1] коллекции данных, цели их создания и научные 
исследования, планируемые к осуществлению с их помощью, позволяют перейти к постановке 
задач для решения на базе перспективных информационных и телекоммуникационных 
инфраструктур, обеспечивающих поддержку открытой науки. 

4. Европейские проекты исследовательских инфраструктур и вех 

Исследовательские инфраструктуры (Везеагсіі Іпітазіігисііигез), создаваемые в ЕС, 
представляют собой средства, ресурсы или сервисы уникальной природы, которые были 
идентифицированы в различных областях сообществами исследователей Европы для поддержки 
соответствующей деятельности на уровне Евросоюза. Подобное определение исследовательской 
инфраструктуры, включая ассоциированные с ней людские ресурсы, охватывает крупное 
оборудование или наборы инструментов вместе с содержащими знания ресурсами, такими как 
коллекции данных, архивы или банки данных. ЦЕРН - родоначальник идеи исследовательских 
инфраструктур. 


Е-инфраструктуры определяются в терминах объединения сетей, гридов, центров данных и 
сред взаимодействия, намерения по отношению к ним предполагают включение в них центров 
поддержки операций, регистров сервисов, сервисов достоверных рекомендаций, авторизации 
сертификатов, тренировочных и консультационных сервисов. Примерами действующих в Европе е- 
инфраструктур являются ОЕАІМТ (высокоскоростные сети - ННрУ/ѵѵѵѵѵѵ.йеапІ.огя/) , ЕСІ (облачные 
и грид-вычисления - ННрзУ/ѵѵѵѵѵѵ.ейі.еи/) , РВАСЕ (суперкомпьютерные вычисления - 
ГіНрУ/ѵѵѵѵѵѵ.ргасе-гі.еи/) , ЕІЮАТ (общие сервисы обмена данными в гетерогенных сетях - 
ИіІрзУ/ѵѵѵѵѵѵ.еисІаІ.еи/) , ЮСЕ (вычисления в толпе - НіІрУ/ісІйі-зр.еи/ ). Ореп Аіге (хранилище 
научных статей - ІтіІрзУ/ѵѵѵѵѵѵ.орепаіге.еи/ ). 

Европейский стратегический форум исследовательских инфраструктур (Еигореап 51гаІе§у 
Рогигп оп ВезеагсН I п^га5І;гис1;иге5, Е5РКІ) является стратегическим механизмом, образованным в 
2002 г. странами — членами ЕС и Еврокомиссией, чтобы способствовать научной интеграции 
Европы и усилению ее международного влияния. Члены Е5РКІ назначаются министрами науки 
стран — членов или ассоциированных членов ЕС, а также включают представителей Еврокомиссии. 
Они работают совместно для формирования объединенного видения и общей стратегии, 
включающих в качестве инструментов планирования и реализации новых панъевропейских 
исследовательских инфраструктур регулярно обновляемые дорожные карты, отчеты и критерии. 
Подобный стратегический подход нацелен на обеспечение Европы наиболее современными 
исследовательскими инфраструктурами, отвечающими нуждам быстро развивающихся областей 
науки, продвижение основанных на знаниях технологий и расширение их применений. 

Некоторые инфраструктуры квалифицируются Е5РКІ как вехи (Еапсітагкз) если они достигли 
фазы реализации и могут быть позиционированы как панъевропейские хабы научного 
совершенства, генерирующие новые идеи и раздвигающие границы науки и технологии. 

Дорожная карта Е5РВІ 2016 г. [4] включает 21 проект исследовательских инфраструктур и 29 
инфраструктур, квалифицированных как вехи. По областям применения они классифицированы 
так: 


• Энергия (4 проекта и 1 веха) 

• Окружающая среда (5 проектов и 5 вех) 

• Здоровье и пища (8 проектов и 6 вех) 

• Физические науки и инженерия (3 проекта и 11 вех) 

• Социальные и культурные инновации (1 проект и 5 вех) 

Примеры проектов и вех: 

• энергетика (проект: ЕІІ-50ЕАКІ5 - Европейская исследовательская инфраструктура 5СИАВ для 
концентрированной солнечной энергии, завершение в 2020 г., 120 миллионов евро; веха: ЛНК 
- реактор Юлия Горовица, завершение в 2020 г., 1 миллиард евро); 

• окружающая среда (проект: 5105 (БѵаІЬагсІ Іп(е§га(есІ Агсііс ЕагіГі ОЬзегѵабоп Бузіегп) - 
интегрированная система наблюдений Арктики на Шпицбергене, завершение 2020 г., 80 
миллионов евро; веха: иРеѴѴаІсІт - исследование биоразнообразия и экосистемы, 
завершение в 2016 г., 66 миллионов евро); 

• здоровье и пища (проект: АпаЕЕ - инфраструктура для анализа и экспериментов в 
экосистемах, завершение 2018 г., 200 миллионов евро; веха: ЕЫХІВ - распределенная 









инфраструктура поддержки информации в науках о жизни, завершение в 2014 г., 125 
миллионов евро); 

• физические науки (проект: СТА - массив телескопов Черенкова, завершение 2023 г., 297 
миллионов евро; веха: Е-ЕИ - Европейский гигантский телескоп, завершение 2024 г., 1 
миллиард евро); 

• инновации в области социальной сферы и культуры (проект: Е-КІН5 - Европейская 
исследовательская инфраструктура в области науки наследия, завершение в 2022 г., 4 
миллион евро; веха: ОАКІАН ЕКІС - цифровая исследовательская инфраструктура в области 
искусства и гуманитарной сферы, завершение в 2019 г., 4.3 миллиона евро). 

5. Проекты инфраструктур поддержки Открытой науки в Европе 

В настоящем обзоре особое внимание уделено перспективным проектам инфраструктур, 
которые уже организованы или будут организованы в рамках конкурсов НОВІ20М 2020, нацеленных 
на организацию открытых исследовательских данных, развитие наук с интенсивным 
использованием данных, создание крупных инновационных распределенных инфраструктур для 
совместного использования данных исследователями в разных странах Европы. 

Оставаясь в рамках рабочей программы НОВІ20М 2020 [5] для проведения конкурсов в 2016 
- 2017 годах в области исследовательских инфраструктур, включая е-инфраструктуры, в настоящей 
работе главным образом анализ будет сфокусирован на теме «еіп/газігисіигез апд Еигореап Ореп 
Зсіепсе СІоисІ» ( ЫірзѴ/ес.еигора.еи/сІійііаІ-зіпйІе-тагкеі/еѵепІз/сіУісІ-ргороБегз-сіаѵ-гоІб/ІІет- 
сІІ5рІаѵ.с1тт?ісІ=18473 ). 

В аспекте е-инфраструктур организуются два конкурса [6] по темам: 

• ЕІМРВА-12-2017: е-инфраструктуры данных и распределенных вычислений для Открытой 
науки и 

• ЕІМРВА-21-2017: инновации е-инфраструктур, движимых платформами. 

ЕІЫРВА-12-2017 покрывает две взаимодополняющих области е-инфраструктур, тесно 
связанных с целью сделать исследовательские данные обнаруживаемыми, доступными, 
оцениваемыми, понятными, пригодными для использования и, где возможно, 
интероперабельными: 

(а) Защищенные и динамичные данные и е-инфраструктуры для распределённых 
вычислений. Вызов состоит в том, чтобы интегрировать на общеевропейском уровне географически 
и дисциплинарно-распределённые ресурсы ради масштабируемой экономии и достижения 
эффективности в предоставлении наилучших данных, вычислительных возможностей и сервисов 
исследовательскому и образовательному сообществу. Эти намерения связаны с программой 
ІМРВА0ЕѴ-04-2016, "Еигореап Ореп Зсіепсе СІоисІ /ог КезеагсЬ" . 

(б) Платформы доступа к научной информации и ее сохранения: поддержка интеграции и 
консолидации е-инфраструктур для надёжного и постоянного открытого доступа к цифровой 
научной информации, основанного на существующих инициативных проектах из конца в конец чрез 
всю Европу (ведомственные и тематические хранилища, агрегаторы и т.д.). 

Основная цель инициативы ЕІЫРВА-21-2017 состоит в поддержке публичного 
распространения инновационных РІРС-систем, которые должны обеспечить пропускные 
способности, требуемые в будущих поколениях е-инфраструктур, чтобы отвечать долгосрочным 




нуждам исследовательских и образовательных сообществ на отрезке времени 5-10 лет. Ключевыми 
моментами здесь являются улучшение координации спроса и предложения в европейских НРС 
экосистемах и поддержка эволюции сервисов е-инфраструктур, основанных на ресурсах данных 
экзамасштаба. 

Оба конкурса ЕІІМРВА представляют собой конкретные шаги в реализации проекта Еигореап 
Ореп Бсіепсе Сіоиб [7], предусмотренного в рамках Еигореап СІоиб Іпіііаііѵе [8], стартовавшей в 
апреле 2016 года. Проект имеет целью интеграцию и консолидацию е-инфраструктур, образование 
федерации существующих исследовательских инфраструктур и научных облачных систем, развитие 
облачных сервисов для Ореп Бсіепсе [9]. Еигореап СІоиб Іпібаіііѵе является частью пакета мер для 
Ріщіізіпй Еигореап іпсіизігу, направленных на усиление позиции Европы в инновациях, движимых 
данными, улучшение их конкурентоспособности и их тенденции к консолидации усилий, а также 
способствует созданию в Европе РіаіІаІ Біпйіе Матке! . 

5.1 Проект Обменных Сервисов Открытой науки 

Существующие сообщества ЕСI и ЕІІРАТ объединяют усилия, чтобы разрешать вопросы 
текущей фрагментации данных и ландшафта вычислительных е-инфраструктур, и ищут 
сотрудничества с частными и общественными партнерами с целью создания и расширения 
тематических сервисов, поддерживающих исследовательские потоки работ Открытой науки. Эти 
сервисы будут технологически и операционно-интегрированы с обобщенными функциями 
вычислений, хранения, управления данными и безопасности с целью обеспечения более богатого 
набора цифровых инструментов для европейских и международных исследовательских сообществ. 
Управление сервисами, обучение и техническая поддержка также подразумеваются в проекте. 

Консорциум ЕСI & ЕІЮАТ готовит предложение, которое будет представлено как часть 
конкурса Н2020 ЕІІЧРВА-12-2017 (подтема (а), безопасные и динамичные данные и е- 
инфраструктуры для распределённых вычислений). Целью проекта является неразделимость 
инфраструктурных сервисов, формирования сообщества пользователей и тренинга. Это может 
привнести в существующие научные сообщества новые мощные возможности выполнения 
исследований, а вокруг инструментов и данных могут консолидироваться новые сообщества. 
Проект направлен на создание истинно открытых и способствующих взаимодействию платформ, 
пригодных для управления, анализа, совместного и повторного использования, а также сохранения 
исследовательских данных, на основе которых могут развиваться инновационные сервисы, 
способные внести новый вклад в мировое научное сообщество. 

В следующих подразделах рассматриваются положения о функциональности и начальном 
состоянии составляющих это предложение инициатив ЕСІ и ЕІЮАТ. Для ЕІЮАТ также будут 
представлены оценки ожидаемых результатов развития проекта Е1ЮАТ2020, выполняемого с 2015 
года. 


5.1.1. Федерация ЕСІ 

ЕСІ [10] является федерацией центров данных, направленных на предоставление 
исследователям передовых вычислительных услуг. Она управляется Фондом и Советом ЕСІ. Грид 
распределённых вычислений был изначально задуман в 1999 году с целью анализа 
экспериментальных данных, которые должны были поступать с Большого адронного коллайдера в 
ЦЕРНе. Европейский проект РаІаСгісІ, который стартовал в 2001, развивал исследования и 
разработку грид технологий и продемонстрировал успешность применения гридов в различных 
областях исследований — физике высоких энергий, наблюдениях Земли и биоинформатике. 








Начиная с марта 2004 года, дальнейшая работа по развитию гридов выполнялась серикй проектов 
ЕСЕЕ (ЕпаЫіп§ СгісІ Іюг Е-зсіепсЕ). 

С сентября 2007 по декабрь 2009 существовала Европейская инициативная студия дизайна 
гридов. Фонд ЕСІ, названный ЕСІ. ей, был основан 8 февраля 2010 года с целью координации и 
поддержки Европейской инфраструктуры гридов — долгосрочного общеевропейского проекта, 
созданного для поддержки европейских исследовательских сообществ и их международного 
взаимодействия. 

Проект ЕСІ-ІпБРІВЕ, нацеленный на создание бесшовной системы, готовой служить 
требованиям научной деятельности настоящего и будущего, поддерживал функционирование ЕСІ 
в течение четырех лет до декабря 2014. 

Проект Е6І-Еп§а§е стартовал в марте 2015 для ускорения реализации Ореп Бсіепсе Соттопз 
путем расширения возможностей европейской магистрали федеративных сервисов для 
вычислений, хранения данных, коммуникаций, обмена знаниями и опытом, дополняя 
специфичные для сообществ возможности. 

В 2016 году европейская ѲВЮ-инфраструктура стала называться ЕСІ. ЕСІ является 
федерацией провайдеров хранения данных и проведения вычислений, объединенных миссией по 
поддержке научных исследований и разработок. 

Федеративное Облако ЕСІ является облаком ІааБ-типа (ІпІтазІтисІіиге-аз-а-Бегѵісе - 
инфраструктура как услуга), состоящим из приватных академических облаков и 
виртуализированных ресурсов, построенных на основе открытых стандартов. Результатом является 
новый тип исследовательской е-инфраструктуры, основанной на зрелых сервисах федеративных 
операций, что делает ЕСІ надежным ресурсом для науки. ЕСІ поддерживает следующие облачные 
сервисы: 

• СІоисІ Сотрите - выполнение виртуальных машин с полным контролем над 
вычислительными ресурсами; возможность выбора предварительно сконфигурированных 
виртуальных устройств (например, процессор, память, диск, операционная система или 
программное обеспечение) из каталога, тиражированного через всех поставщиков облачной 
инфраструктуры ЕСІ; 

• СІоисІ Сопіаіпег Сотрите - выполнение Ооскег-контейнеров в легковесной среде 
виртуализации; 

• Тгаіпіп§ іп^газігисііиге - выделенные вычислительные средства и средства хранения для 
тренинга и обучения. 

Федеративная е-инфраструктура ЕСІ финансируется публично и включает (по состоянию на 
сентябрь 2016): 

• 826 500 ядер, доступных для высокопроизводительных вычислений; 

• 6 600 ядер, доступных для облачных вычислений; 

• 285 РВ для оперативного хранения; 

• 280 РВ для хранения архивов. 

Эта инфраструктура включает в себя также федеративные облачные провайдеры ЕСІ и 
федеративные центры данных ЕСІ. 



5.1.2. Е1ЮАТ2020 

Европейская комиссия поддерживает развитие панъевропейской междисциплинарной 
инфраструктуры данных в рамках программы Ногіюп 2020, следуя нескольким ведущим 
принципам. 

Федерализация. Предполагается, что основные действия над данными реализуются в 
федерациях данных. Они являются сетями репозиториев и центров данных, которые 
предоставляют структуры для обработки данных и действуют на основе соглашений о легальных 
или этических правилах, интерфейсах и спецификациях протоколов, а также стека общих сервисов 
манипулирования данными. Такие центры могут являться членами многих федераций. 
Координированный подход предполагает, что каждый центр создает описание своих 
возможностей, а каждая федерация может использовать одни и те же описания для извлечения 
необходимой информации. Такой подход способствует открытому представлению 
исследовательских данных и помогает изменять существующую культуру исследований для 
поддержки совместного использования данных. 

Открытое совместное использование данных. Поскольку научные дисциплины 
интернациональны по своей природе, то критичным является следование международным 
подходам к снижению барьеров при обмене данными или при их повторном использовании. На 
этом пути основными препятствиями являются неоднородность данных и языков запросов, 
способность к пониманию и обнаружению данных, перемещение данных сквозь семантические 
границы между многозначными контекстами, а также проблемы рассогласования данных 
(относительно качества, неполноты, абстракции данных). 

Европейская инфраструктура данных ЕІЮАТ [11] является начальным шагом в этих 
направлениях. ЕІЮАТ объединяет 25 европейских партнеров, включающих центры данных, 
провайдеры технологий, сообщества исследователей и фондовые агентства из 15 стран. ЕІЮАТ 
предлагает общие сервисы данных в рамках географически распределенной сети, связывающей 
центры данных и специализированные репозитории, а также решения для поиска, совместного 
использования, хранения, репликации, стадийности первичных и вторичных данных исследований 
и выполнения их анализа. Такая сеть образует Совместную инфраструктуру данных (СоІІаЬогаІіѵе 
Оаіа Іп^газігисіиге), обозначаемую далее СИД, которая развивается как сервис-ориентированная, 
междисциплинарная и устойчивая инфраструктура. Ее сервисы были разработаны в тесном 
сотрудничестве с более чем 50 междисциплинарными научными сообществами, вовлеченными во 
все этапы процесса проектирования. Учреждение СИД ЕІЮАТ является своевременным в свете 
предстоящей реализации Европейского облака Открытой науки (Еигореап Ореп Бсіепсе СІоисІ), 
которое нацелено на предоставление открытых и бесшовных услуг для хранения данных, 
управления, анализа и повторного использования данных исследований в разных научных 
областях. 

Сервисы ЕІЮАТ для научных сообществ: 

• В2РРЮР 5упс апсі Ехсбап§е Везеагсб Оаіа (Синхронизация и обмен исследовательскими 
данными): персональное облачное решение, основанное на доверенном домене ЕІЮАТ СОI, 
для хранения и совместного использования наборов данных на ранних этапах жизненного 
цикла исследовательских данных; 

• В25НАВЕ Біоге апсі БІіаге Везеагсб Оаіа (Хранение и совместное использование 
исследовательских данных): удобный в пользовании, надежный и защищенный сервис для 


научных сообществ, предназначенный для хранения и совместного использования 
небольших наборов исследовательских данных, полученных из разнообразных источников; 

• В2РІМЭ РіпсІ Кезеагсб Оаіа (Поиск исследовательских данных): простой, удобный в 
пользовании портал для нахождения коллекций исследовательских данных, сохраненных в 
центрах данных ЕІЮАТ и других репозиториях данных; 

• В25АРЕ Веріісаіе Кезеагсб 0а1:а Ба-реіу (Безопасная репликация исследовательских данных): 
устойчивый, безопасный и высоконадежный сервис для управления данными и их 
репликацией позволяет репозиториям сообществ и департаментов тиражировать и хранить 
исследовательские данные на узлах данных ЕІЮАТ; 

• В25ТАСЕ СеТ ОаТа Іо СотриШіоп (Извлечение данных для вычислений): надежный, 
эффективный и простой в использовании сервис для перемещения больших объемов 
исследовательских данных между узлами данных ЕІЮАТ и рабочими областями 
высокопроизводительных вычислительных систем. 

Важным примером консолидированной архитектуры для взаимодействия с 
инфраструктурами в науках о жизни, позволяющей структурным биологам извлечь пользу из 
универсальных сервисов, разработанных ЕІЮАТ и ЕСІ, является проект ѴѴезІ-І-ІІе [13], 
представляющий собой виртуальную исследовательскую среду Н2020, которая предоставит 
сервисы прикладного уровня, приспособленные для сценариев использования в структурной 
биологии, покрывая все методики эксперимента (например, рентгеноскопия (Хгау), электронная 
криоскопия (сгуо-ЕМ), ядерная магниторезонансная томография (ММВ), малоугловая 
рентгеноскопия (5АХ5)). 

3-го октября 2016 года шестнадцать крупных европейских исследовательских организаций, 
вычислительных центров и центров данных подписали соглашение о поддержке ЕІЮАТ как 
панъевропейской коллаборативной инфраструктуры данных в течение следующих 10 лет. 
Организации сплотились для реализации долгосрочного плана устойчивого развития и внесения 
вклада в разработку, поддержку и развертывание панъевропейских сервисов для 
исследовательских данных и координацию практик управления исследовательскими данными по 
всем центрам. 

Е1ЮАТ2020 [12] — трехлетний большой проект развития СИД, начатый в 2015 г., целями 
которого являются: поддержка политики Европейской комиссии открытого доступа к данным 
исследований, достижение интероперабельности существующих в Европе инфраструктур научных 
исследований (ИНИ) для доступа ученых к сетевым, вычислительным ресурсам и ресурсам данных 
в различных ИНИ, включая гриды и облачные инфраструктуры. Так, например, будут достигнуты 
возможности подключения данных в СИД к высокопроизводительным ресурсам, организуемым в 
рамках РВАСЕ (РагІпегзНір Тог АсІѵапсесІ Сотрибп§ іп Еигоре), для их анализа или в качестве входных 
данных моделей и репликации полученных результатов в систему хранения ЕІЮАТ; подключения 
данных в СИД к гридам и облачным ресурсам, поддерживаемым ЕСІ (Еигореап СгісІ Іп^газігисіиге); 
а также федерализации данных при их подключении к ряду европейских инициатив(таких как 
ІМеЬиІа, СЕАІМТ, ТЕРЕМА, ОрепАІВ и др.). При организации Е1ЮАТ2020 достигнута договоренность о 
партнерстве с N05 по образованию совместных пилотных проектов (междисциплинарных и 
межконтинентальных). В СИД будет поддерживаться функция долгосрочного архивирования 
данных, репликации, каталогизации, цитируемое™ данных наряду с обеспечением обнаружения, 
доступа, повторного использования коллекций и отдельных объектов данных. Функции анализа 
данных будут поддерживаться ресурсами ЕСІ и РВАСЕ, а также средствами, образуемыми на основе 
виртуализации вычислительного оборудования центров данных и кластерных платформ. 



Специальная программа в рамках Е1ЮАТ2020 ориентирована на создание средств оценки качества 
данных и сертификации репозиториев данных в СИД. Е1ЮАТ2020 развивает 
мультидисциплинарный подход, охватывая сообщества исследователей в гуманитарных областях 
и в социальных сетях (СЕАВІІ4 — Соттоп Еап§иа§е Кезоигсез апсі ТесІіпоІо§у Іп1тас1:гис1:иге, ОАКІАН, 
СЕ55РА), в науках о Земле и атмосфере (ЕРОБ — Еигореап РІаіе ОЬзегѵіп§ Бузует, ІСОБ, ЕМБО, ѴЕВСЕ, 
ІАСОБ, ЭВИНМ), науке о климате (ЕІЧЕБ — Еигореап Ыеіѵѵогк ^ог ЕагІІі Бузует), биоразнообразии 
(и^еѴѴаІсЬ, ПЕВ, ІМагіпе), науке о жизни (ѴРН, ЕЫХІВ, ВВМВІ, ЕСКІІЧ, ІІЧСР, РІХА) и физике (ЕІ5САТ, 
ЕІІВО-ѴО, 1515, ѴѴЬС6, РаІ\ІсІа1:а). Значительное внимание в проекте будет уделено динамическим 
данным и научным потокам работ, созданию сервисов управления динамическими данными, 
оставаясь в рамках СИД. Эти исследования будут опираться на сценарии динамического 
использования данных из ЕІМЕ5 и ЕРОБ и обобщения их для анализа будущих динамических данных 
при решении реальных научных задач. Одним из планируемых результатов будет создание модели 
и языка представления жизненного цикла данных, сервисных инфраструктур и происхождения 
данных. Одновременно будут происходить исследования инфраструктурных операций более 
эффективных, надежных, устойчивых и близких к потребностям научных сообществ. Примерами 
планируемых задач являются следующие: оценка объектно-ориентированной среды хранения для 
машин баз данных, центров данных при создании масштабируемой и интероперабельной СИД на 
основе облачных решений; расширение возможностей уровня долговременного хранения путем 
применения распределенной графовой базы данных для поддержки отношений между объектами 
данных вместо собственной базы метаданных, используемой в настоящее время в В25НАВЕ- 
сервисе (по замыслу это должно сблизить подходы в СИД с применениями семантического веба, 
поддержкой происхождения данных и семантического аннотирования). 

5.1.3 Особенности планируемого проекта ЕСІ & ЕІЮАТ 

ЕСІ & ЕІЮАТ объединяют усилия для решения проблемы текущей фрагментации данных и 
ландшафта вычислительных е-инфраструктур и ищут частных и общедоступных партнеров, 
разрабатывающих и/или предоставляющих тематические услуги, которые поддерживают 
исследовательские потоки работ Открытой науки. Эти сервисы будут технически интегрированы с 
общими средствами вычислений, хранения данных, управления данными и безопасности для 
обеспечения более богатого набора цифровых возможностей для европейских и международных 
коллаборативных исследований. Управление сервисами, тренинг и техническая поддержка будут 
также частью этого проекта [14]. 

Эти партнеры должны быть экспертами в предоставлении сервисов, инструментов или 
платформ, включая анализ данных, научные приложения, наборы данных, публикации и другие 
объекты исследования, чтобы эти сервисы можно было легко найти, получить доступ и 
использовать их снова и снова для получения новых знаний и стимулирования инноваций. 

Насколько можно судить, проект будет нацелен на соединение инфраструктурных решений 
ЕСІ (облачная инфраструктура, центры данных, вычислительные сервисы) с сервисами данных 
ЕІЮАТ, чтобы обеспечить целостное решение для доступа сообщества исследователей к 
исследовательским данным. 

5.2 Инициатива Евросоюза по созданию Европейского облака открытой науки 

(Е05С) 

В этом разделе рассматриваются основные этапы развития программы создания ЕОБС и 
связанных с ними публикаций: 


• фиксация принципов РАІВ данных, ориентированных на поддержку ряда международных 
инициатив (включающих прежде всего Е05С [8] и проект N114 Ві§ Оаіа Іо Кпо\л/ІесІ§е (ЕЮ2К, 
Ьі:1:р://сіа{а$сіепсе.піІг§оѵ/Ьсі2к)) и служащих в качестве руководства по приданию всем 
данным и связанным с ними сервисам свойства быть обнаруживаемыми (РіпсІаЫе), 
доступными (АссеззіЫе), интероперабельными (ІпІегорегаЫе) и повторно используемыми 
(ВеизаЫе) в Интернете данных не только для людей, но, что особенно важно, также и для 
машин. Принципы РАІВ опубликованы в марте 2016 г. [15] и ранее в [16]; 

• объявление Еврокомиссии в апреле 2016 г. об инициативе Европейского облака [8], которое 
должно обеспечить Европе глобальное лидерство в экономике, движимой данными; 

• заявка на реализацию международного проекта создания Интернета РАІК данных и сервисов, 
координируемого Нидерландами (июнь 2016 г.); 

• первый отчет Экспертной группы высокого уровня, учрежденной Европейской Комиссией, 
содержащий рекомендации Еврокомиссии по предварительному этапу создания Е05С 
(октябрь 2016 г.). 

Этот перечень завершается разделом, посвященным пилотному проекту исследования 
возможности развития инфраструктуры ЕІЮАТ для обеспечения интероперабельности данных на 
основе принципов РАІВ. 

Принципы РАІК были приняты в качестве основополагающих критериев для групп, 
работающих над созданием исследовательских инфраструктур, политических групп, фондирующих 
организаций и др., включающих, например, ІІіе 620 Напагііои Сопсепзиз, Атзіегсіат СаІІ Рог Асбоп 
оп Ореп 5сіепсе, Иге МН Раіа Соттопз и Иге Еигореап Ореп 5сіепсе СІоисІ . Так, поддержка идеи РАІР 
на саммите 620 в Ханчжоу 4-5 сентября 2016 г. выражена так: «\Л/е зиррогі: арргоргіаіе еДогІз Іо 
рготоіе ореп зсіепсе апсі ^асііііаіе арргоргіаіе ассезз Іо риЫісІу ТипсІесІ гезеагсіг гезиііз оп ТіпсІаЫе, 
ассеззіЫе, іпІегорегаЫе апсі геизаЫе (РАІВ) ргіпсіріез». 

5.2.1 Принципы представления РАШ данных 

На протяжении последних двух-трех лет в результате многочисленных обсуждений 
выкристаллизовалась насущная потребность в создании инфраструктуры, которая поддерживала 
бы свойства РАІК данных, являющихся результатом исследований (в том числе, в рамках Открытой 
науки). Участники таких обсуждений из разнообразных областей, представляющих академическое 
сообщество, промышленность, фондирующие агенства, научные издательства пришли к 
соглашению о выработке лаконичного и формализуемого набора принципов, объявленного как 
РАІВ 0а1:а Ргіпсіріез. В отличие от инициатив, сфокусированных на предоставлении возможностей 
повторного использования данных людьми, принципы РАІК нацелены на повышение способностей 
машин автоматически находить и использовать данные в дополнение к поддержке повторного 
использования данных людьми. Более того, инструменты и потоки работ, связанные с такими 
данными, также должны обладать свойствами РАІВ (быть обнаруживаемыми (РіпсІаЫе), 
доступными (АссеззіЫе), интероперабельными (ІпІегорегаЫе) и повторно используемыми 
(ВеизаЫе)) [15][16]. Данные принципы применимы в общем случае не только к самим данным и 
сервисам, но и к методам, программам, статьям и документам, относящимся к исследованиям. 

К этим четырем был впоследствии добавлен принцип цитируемое™ данных и других 
исследовательских объектов. Помимо глобальной идентификации и авторов, цитирование должно 
содержать информацию о версиях, временных интервалах, используемых фрагментах данных, 
происхождении используемых вторичных данных. Помимо этого, необходимо понимать, что 
цитирование может производиться и между сообществами разных предметных областей и должно 







учитывать специфику этих сообществ. Таким образом, становится возможным долговременное 
цитирование изменчивых, мигрирующих, новых, теряющих актуальность и даже не хранимых 
данных. [17]. 

Большинство видов повторно используемых данных, требующих больших затрат на их 
производство, являются специализированными базами данных. Принципы РАІВ требуют, 
публикации достаточно подробных метаданных, определяющих такие данные и позволяющих 
обнаруживать их содержимое. Схемы метаданных должны быть доступными вместе с любыми 
ограничениями доступа к соответствующим данным. Наряду с такими видами тщательно 
сопровождаемых баз данных, важные данные образуются в процессе проведения различных 
экспериментов в виде быстро растущего разнообразия репозиториев разного назначения и форм, 
унификация и приведение к общему виду типов данных в которых практически трудно реализуемы. 
Примеры репозиториев такого вида содержатся в [15]. Это означает, что создаваемая 
инфраструктура должна быть более разнообразной ввиду усложнения повторного использования 
данных для людей и машин. 

Собственно, руководящие принципы представления РАІВ данных опубликованы в [15] 
следующим образом (учитывая важность однозначной трактовки этих определений, предпочтение 
отдано их публикации на языке оригинала): 

• То Ье РіпсІаЫе: Р1. (те1а)сіа1:а аге аззі§песІ а §ІоЬаІІу ипіцие апсі регзізіепі: ісІепіЖег; Р2. сіаіа аге 
сІезсгіЬесІ ѵѵііИ гісіі те1:асіа1:а (беРіпесІ Ьу В1 Ьеіоѵѵ); РЗ. те1:асіа1:а сіеагіу апсі ехріісіііу іпсіибе 1Ье 
ісіепііігег оНЬе сіаіа іі сІезсгіЬез; Р4. (те1:а)сІа1:а аге ге§із1:егесІ ог іпсіехесі іп а зеагсЬаЫе гезоигсе. 

• То Ье АссеззіЫе: А1. (те1а)сІа1:а аге геІгіеѵаЫе Ьу іЬеіг ісІеп1:Ипег изіп§ а зіапсіагсіііесі 
соттипісабопз ргоіюсоі; А1.1іЬе ргоіюсоі із ореп, Ыее, апсі ипіѵегзаііу ітрІетепІаЫе; А1.2 1Ье 
ргоіюсоі аііоѵѵз Рог ап аиіЬепІісабоп апсі аиіЬогііаІіоп ргосесіиге, \л/Ьеге песеззагу; А2. те1:асІа1:а 
аге ассеззіЫе, еѵеп \л/Ьеп 1Ье сіаіа аге по Іоп§ег аѵаіІаЫе. 

• То Ье ІпіегорегаЫе: II. (те1а)сІа1:а изе а ІюгтаІ, ассеззіЫе, зЬагесІ, апсі ЬгоасІІу аррІісаЫе 
Іап§иа§е -рог кпо\л/ІесІ§е гергезепіабоп; 12. (те1:а)сІа1:а изе ѵосаЬиІагіе5 іЬаІ РоІІоѵѵ РАІК ргіпсіріез; 
13. (теІа)сІа1:а іпсіисіе циаІіРіесІ геРегепсез Ро оРЬег (теРа)сІаРа. 

• То Ье НеизаЫе: К1. теРа(сІаРа) аге гісЫу сІезсгіЬесІ \л/ІРЬ а рІигаІІРу оР ассигаРе апсі геІеѵапР 
аРРгіЬиРез; К1.1. (теРа)сІаРа аге геіеазесі \л/ІРЬ а сіеаг апсі ассеззіЫе сІаРа иза§е Іісепзе; В1.2. 
(теРа)сІаРа аге аззосіаРесІ ѵѵіРРі сІеРаіІесІ ргоѵепапсе; К1.3. (теРа)сІаРа тееР сіотаіп-геіеѵапр 
соттипіРу зРапсІагсІз. 

Сочетание «(мета)данные» означает, что действие соответствующего принципа 
распространяется как на данные, так и на метаданные. Какие-либо соображения относительно 
техники реализации представлений РАІК данных и метаданных были намеренно опущены в [15). 
Примеры крупных биомедицинских коллекций, приведенных в этой статье, позволяют употребить 
интуицию для рассуждений о метаданных, которые следует использовать для поддержки 
различных принципов (Р, А, I, В). 

Вместе с тем, в самом начале опубликование принципов РАІВ организацией РОВСЕ11 в 2014 
г. [16] сопровождалось предложениями не по технической реализации таких принципов, а 
определением необходимых характеристик данных, метаданных, сервисов и инфраструктур для 
того, чтобы данные были РАІРС_Прежде всего, в нем введено понятие «Объекта данных» как 
идентифицируемой статьи данных (сіаіа ііет), включающей элементы данных, метаданные и 
идентификатор. 


Например, принцип "іо Ье іпІегорегаЫе" уточняется следующим образом: 


• 3. 0а1:а ОЬіесІз сап Ье ІпІегорегаЫе опіу Нт 

• 3.1. (Меіа) сіаіа І5 тасЫпе-асІіопаЫе ( ЫірзѴ/ѵѵѵѵѵѵіогсеІІ.огй/посіе/бОбг^Аппехб-Э) 

• 3.2. (Меіа) сіаііа Іогтаіз иЫііе зЬагес) ѵосаЬиІагіез апсі/ог опіюіо^іез 
( Ыір5://ѵѵ\л/ѵѵ.1 : огсе11.огй/посІе/6062/#Аппех6-9 ) 

• 3.3 (Меіа) сіаіа ѵѵііНіп іЬе Оаіа ОЬіесІ: зЬоиІсІ іЬиз Ье ЬоіЬ зупіасііісаііу рагзеаЫе апсі зетапИсаІІу 
тасЫпе-ассеззіЫе (Ы:1:р5://\л/\л/\л/.-| : огсе11.ог§/пос1е/60б2/#Аппех10-11) 

Здесь пункты 3.1, 3.2 и 3.3 сопровождаются ссылками на соответствующие разделы 
документа [16], содержащие определения, позволяющие неформально проверять, являются ли 
данные в некоторой конкретной инфраструктуре РАІВ. Если при такой проверке ответ 
отрицательный, то можно дать объяснение, почему. 

Учитывая, что для обеспечения охвата конкретной инфраструктуры данных средствами 
Е05С принципы РАІВ должны поддерживаться, в ближайшее время можно ожидать появления 
большого числа разнообразных технических реализаций РАІВ данных. В настоящей публикации 
даны несколько примеров начала такого движения - в том числе, в следующем параграфе 
рассматриваются тьюториалы, представленные на конференции в декабре 2016 г. в Амстердаме, а 
в разделе 5.2.5 даны краткие сведения о пилотном проекте ЕІЮАТ по исследованию возможности 
поддержки принципов РАІВ в инфраструктуре ЕІЮАТ. 

Пять тьюториалов, представленных на 9-й Международной конференции «БетапИс ѴѴеЬ 
Арріісаііопз апсі Тооіз Іюг ЬН'е Бсіепсез» в Амстердаме 5-8 декабря 2016 г. в некоторой степени 
монстрировали, как РАІК принципы могут быть достигнуты с помощью средств Семантического 
Веба. Так, например, показано, как 18 словарей, составленных на КОР, удалось использовать для 
представления общих элементов метаданных и множеств их значений. В спецификациях был 
выделен 61 обобщенный элемент метаданных, относящихся к описанию данных для 
лицензирования, атрибутирования, образования версий, происхождения данных, аннотирования 
контента. Показано, как существующие словари можно использовать для удовлетворения 
требованиям представления РАІК данных при реализации индексирования, обнаружения данных, 
обмена данными, а также запросов и поиска при помощи БРАКОІ. в наборах данных. Для 
надлежащего представления клинических данных, их интеграции и поддержки федераций данных, 
поддерживаемых в ряде больниц, использовались РЮР, онтологии на В0Р(5) и ОѴѴЦ а также 5РАВЩ. 
Показано, как переходить от метаданных в ОІСОМ к их представлению в РШР. В одном из 
тьюториалов было показано, как от спецификации на РНІВ стандарта НЬ7 переходить к 
представлению метаданных и данных в ВОР. 

Этот параграф завершает краткая аннотация работы, опубликованной в октябре 2016 г. и 
посвященной предложению по интерпретации интероперабельности в контексте РАІВпезз при 
помощи комбинации технологий Семантического Веба [18]. 

Авторы утверждают, что результат хорошо согласуется с принципами РАІВ и рекомендуют 
ее в качестве эталонной реализации РАІВ для случаев неинтероперабельных форматов данных в 
любом репозитории. 

Общие рекомендации по использованию технологий Семантического Веба, собранные 
Н.А.Скворцоым из ряда публикаций, относящихся к поддержке принципов РАІВ, выглядят 
следующим образом. ЫпкесІ Оаіа РІаІІогт (ІЮР) используется для реализации операций чтения 




метаданных по ІІВІ. через НИР для получения данных в РШР. Оаіа Са{аІо§ие ѴосаЬиІагу (йСАТ) 
используется для описания массивов данных, элементов структур данных и для распределения 
данных. Бітріе Кпо\л/ІесІ§е Ог^атіабоп Бузует (БКОБ) - для онтологического описания записей 
данных. Тгіріе Раііегп Рга§теп1:$ (ТРР) позволяет посылать посредством ІІВІ. запросы по образцу, 
аналогичные запросам 5РАВЩ, включающие определение триплетов с переменными. Правила РШР 
МосІеІІІп§ Еап§иа§е (ВМЬ) трансформируют представление оригинальных наборов данных в язык 
РШР. 


Пока целостной реализации принципов РАІВ, которую можно было бы использовать для 
преобразования произвольной коллекции данных в РАІВ коллекцию, не существует. Пожалуй, что 
и подобных попыток до сих пор не было. 

5 . 2.2 Объявление Еврокомиссии об инициативе Европейского облака, которое 
должно обеспечить Европе глобальное лидерство в экономике, движимой данными 

19 апреля 2016 г. Еврокомиссия представила идеи плана создания облачных сервисов и 
глобальной инфраструктуры поддержки науки, бизнеса и общественных услуг с целью получения 
максимальных выгод от революции, вызванной развитием больших данных [19]. 

Европа является крупнейшим производителем научных данных в мире, но недостаточная и 
фрагментированная инфраструктура приводит к тому, что не удается использовать полный 
потенциал этих «больших данных». Путем поддержки и объединения существующей 
исследовательской инфраструктуры, Комиссия планирует создать новое Европейское облако 
Открытой науки (ЕОБС), которое предоставит 1,7 миллионам исследователей Европы и 70 
миллионам профессионалов науки и техники виртуальную среду хранения, совместного и 
повторного использования данных через границы в междисциплинарной среде. Это будет 
подкреплено Европейской инфраструктурой данных, развертыванием сетей с высокой пропускной 
способностью, крупномасштабными средствами хранения данных и суперкомпьютерной 
мощностью, необходимой для эффективного доступа и обработки больших наборов данных, 
хранимых в облаке. Эта инфраструктура мирового класса гарантирует участие Европы в глобальной 
гонке по высокопроизводительным вычислениям в соответствии с ее экономическим и научным 
потенциалом. Цель этой инициативы заключается в создании облака Открытой науки (ЕОБС), чтобы 
сделать науку более эффективной и продуктивной и дать возможность миллионам исследователей 
по всему миру совместно использовать и анализировать исследовательские данные в доверенной 
среде независимо от технологий, дисциплин и границ. Ключевая компонента этого влияния 
заключается в изменении способа выполнения научных исследований по мере быстрого введения 
Открытой науки. 

В процессе создания ЕОБС требуется преодолеть следующие основные технические и 
организационные проблемы: 

• Европейские научные и деловые сообщества, общественные круги не в состоянии 
использовать полный потенциал данных и его трансформационное влияние на 
традиционные способы проведения исследований; данные, получаемые от общественно 
фондируемых исследований, не всегда являются открытыми (например, академическому 
сообществу не всегда ясны преимущества совместного использования данных); 

• фрагментация инфраструктур данных, порождаемая научными и экономическими 
причинами, национальными границами государств, традиционными моделями управления, 
препятствует развитию науки, движимой данными, мультидисциплинарному 
международному научному сотрудничеству; 


• растущие потребности в Европе в создании мирового класса высокопроизводительных 
компьютерных инфраструктур, ориентированных на обработку данных в науке и технике 
(например, для моделирования крупных технических изделий в процессе их создания, 
природных явлений и систем, и пр.); 

• производители и потребители научных данных должны иметь возможность повторного 
использования данных и передовых аналитических методов, включая извлечение знаний из 
текстов и данных, в среде, которая должна быть не менее надежной, чем собственные 
средства. 

В процессе создания Е05С предлагается достичь следующего: 

• Европейское облако открытой науки начнет свое функционирование с федерализации 
существующих научных инфраструктур данных, рассредоточенных сегодня по 
дисциплинарному принципу и географически среди государств - членов ЕвроСоюза; в том 
числе будет обеспечен открытый доступ к публикациям и данным, полученным при 
поддержке Ногігоп 2020 (проекты должны производить данные, удовлетворяющие 
принципам РАІК) при гарантии приватности и защиты данных; изменена структура 
стимулирования академических, промышленных и общественных служб в реализации 
совместного использования данных, а также в усилении подготовки персонала в управлении 
данными, в их надзоре (зІіеѵѵагсІзЫр); 

• создать спецификации поддержки интероперабельности и совместного использования 
данных между различными дисциплинами и инфраструктурами, имея ввиду их 
последующую стандартизацию; 

• создать настраиваемую по месту панъевропейскую структуру управления федерализацией 
научных инфраструктур данных и препятствованием фрагментации; 

• создать облачные сервисы для поддержки Открытой науки, поддерживаемые Европейской 
инфраструктурой данных; 

• расширить базу научных пользователей Е05С исследователями и создателями инноваций из 
всех областей исследований и стран членов Евросоюза, равно как из стран-партнеров и 
глобальных инициатив, также база пользователей Е05С будет расширена за счет 
общественного сектора и промышленности. 

Европейская Инфраструктура Данных (ЕЭІ), реализуемая для поддержки Е05С, должна 
включать высокопроизводительные компьютеры, высокоскоростные сетевые средства и 
передовые сервисы данных (предполагается, что эти сервисы будут основаны на развитии 
существующих сервисов в е-инфраструктурах ОрепАІКЕ, ЕІЮАТ, ЕСІ, ІпсН§о0а1:аСІоисІ, НеІіх№ЬиІа, 
РКАСЕ, СЁАІМТ) для поддержки ученых и других продвинутых пользователей от промышленности и 
общественного сектора. К 2022 в Евросоюзе ожидается создание суперкомпьютера эксамасштаба 
на основе европейской технологии, входящего в число первых трех суперкомпьютеров в мире. ЕЭІ 
будет работать в комбинации с национальными и региональными научными и общественными 
центрами данных при обеспечении должного уровня их интероперабельности. 

Общественные и приватные вложения, необходимые для реализации Европейской 
Облачной Инициативы, оцениваются в 6.7 миллиардов евро. По оценкам Комиссии, 2 миллиарда 
евро будут выделены в рамках программы Н0КІ20М 2020. Дополнительные общественные и 
приватные вложения составляют 4.7 миллиарда евро в течение 5 лет. 



5.2.3 Проект создания Интернета РАШ данных и сервисов 

«СО-РАІВ» - это координированная Нидерландами международная инициатива, целью 
которой является реализация Интернета ГАІК данных и сервисов, в котором аналитические 
инструменты будут соединены с релевантными данными, так что и инструменты и данные должны 
соответствовать требованиям РАІВ (с деталями СО-СНАІК можно познакомиться по заявке на 
реализацию проекта, представленной в июне 2016 г. в агенство №1:іопаІ Ісопз Нидерландов [20]. 

Быстро развивающаяся тенденция заключается в использовании сложной аналитики, 
совмещающей множество источников данных и областей знаний. Глобальные инициативы, будь то 
относящиеся к прецизионной и персонализированной медицине (например, НеаІШ-ВІ в 
Нидерландах), прецизионному сельскому хозяйству, логистике и демографии или охране 
окружающей среды, все они расширяют свои возможности за счет глобальной доступности РАІВ- 
данных и сервисов. 

Проблемы управления данными и аналитики являются очень важными в науках о жизни. 
Именно поэтому СО-РАІВ начнет свою работу именно в этом направлении, но другие научные 
дисциплины также получат выгоду от открытой реализации как междисциплинарно, так и в рамках 
управляемого международного сотрудничества при помощи СО-РАІК. Обеспечивая ключевые 
компоненты Интернета РАІВ данных и сервисов через систему Лабораторий открытой реализации 
(Ореп Ітріетепіабоп БаЬз) ОО-РАІВ, этот проект затронет все секторы глобального общества, а 
также послужит росту экономического потенциала. 

Согласно проекту, Нидерланды позиционируют себя как инновационный центр (ЬиЬ) для 
инициатив Е05С в Европе и инициативы СОММОИ5 в США, которую они считают родственной. 

5.2.4 Европейское облако Открытой науки 

Этот раздел обзора написан на основе первого отчета Экспертной группы, учрежденной 
Европейской Комиссией для выработки рекомендаций по реализации Европейского облака 
Открытой науки (Е05С) [21]. Концепция Е05С трактуется следующим образом: это федеративная, 
глобально доступная среда, в которой исследователи, провайдеры инноваций, компании и 
граждане могут публиковать, находить и повторно использовать данные и инструменты для 
исследований, инноваций и образования. Такая среда должна выращиваться в Европе и за ее 
пределами для обеспечения того, чтобы Европейские исследования и инновации могли полностью 
служить созданию знаний, а также противостоять глобальным вызовам и служить экономическому 
процветанию Европы. Тем самым Е05С будет служить средой для Открытой науки, устраняя 
технические, юридические и гуманитарные барьеры в повторном использовании 
исследовательских данных, инструментов, а также обеспечивая доступ к сервисам, системам и 
потоку данных сквозь дисциплинарные, социальные и географические границы. Термин «облако» 
является метафорой, подчеркивающей бесшовность и общность используемых данных, программ, 
стандартов, экспертизы и политики, относящихся к науке, движимой данными, и к инновациям. 

Среди социальных и технических вызовов на пути создания Е05С в отчете упоминаются: 

• технические вызовы заключаются не столько в объеме данных, а скорее в сложности данных и 
аналитических процедур в различных областях; 

• существование пропасти между провайдерами е-инфраструктур и специалистами в научных 
областях; 

• фрагментация таких областей, приводящая к повторяющимся решениям и изоляции при 
создании и развитии исследовательских инфраструктур; 


• постоянно растущие распределенные коллекции данных становятся все более немобильными, 
а централизация суперкомпьютеров самих по себе становится недостаточной для поддержки в 
сущности федеративного и распределенного мета-анализа и обучения; 

• необходимые для создания первого поколения Е05С компоненты существуют, однако они 
разбросаны и теряются среди 28 стран - членов Евросоюза, а также среди разнообразных 
сообществ. 

К побудительным факторам создания Е05С как части Открытой науки относятся следующие: 
потребность в новых способах коммуникаций в научном мире (с упором на действенность машин); 
осознание и признание необходимости совместного повторного использования данных; 
потребность в инновационных схемах устойчивой поддержки исследовательских инфраструктур; 
требования мультидисциплинарного сотрудничества; Е05С должно играть роль эко-системы над 
инфраструктурами; индикаторы эффективности должны быть определены. 

Облако Е05С должно быть интероперабельным с Интернетом РАІВ данных и сервисов и 
быть доступной инфраструктурой для проведения исследований и введения инноваций. В нее 
входят также опыт людей, ресурсы, стандарты, практические решения и нижележащие 
инфраструктуры. Наряду с управлением данными, в Е05С должен поддерживаться надзор 
(зІеѵѵагсІзЫр) данных, обеспечивающий должное качество данных и препятствующий их утрате. 

Толкование открытости уточняется так, что 'ореп зТіоиІсІ поТ Ье сопіюзесі ѵѵіТТі Ітее' (хотя 
ученые могут ожидать, что данные и связанные с ними сервисы могут использоваться ими 
бесплатно в противоположность коммерческому подходу). Открытость скорее относится к 
доступности всех элементов Е05С при надлежащих и хорошо определенных условиях. 

Ряд тенденций, характерных для Открытой науки, важно учитывать при создании Е05С. Так, 
новые способы научных коммуникаций заключаются в вовлечении в этот процесс главных 
ассистентов исследований - машин, генерирующих и обрабатывающих данные. В Европе, где в 
академической среде до сих пор важность экспертов по данным была сильно недооцененной, 
отсутствие экспертизы данных рассматривается среди основных рисков утраты ведущих позиций в 
науке. 


Развитие кросс-дисциплинарного сотрудничества является важной тенденцией ввиду того, 
что участились случаи использования сырых данных и аналитических средств из других, весьма 
отдаленных дисциплин. В то же время, учитывая отсутствие стандартов приемлемых метаданных и 
специальных поисковых инструментов, трудно обвинять исследователей в изобретении колеса. 
Использование текстов и техники сіаіа тіпіп§ будет важным в Е05С для кросс-дисциплинарного 
использования. 

Важной тенденцией является развитие сложных экосистем инфраструктур. Рост объемов 
данных приводит к необходимости перемещать потоки работ (на основе техники процессных 
виртуальных машин) к данным, а не данных к потокам работ. 

Развитие понимания в машинах, рассматриваемых в качестве ассистентов. Выделяются два 
вида существенно различных функций таких ассистентов (распознавание образов - исключительно 
машинная функция; функция, связанная с семантикой и отображением терминов и 
идентификаторов, отслеживанием происхождения данных, оценкой результатов и их 
интерпретации, требует привлечения когнитивных подходов). Обеспечение действенности машин 
в этой второй функции потребует серьезных усилий. 



Примеры рекомендаций отчета для действий Комиссии на подготовительном этапе, 
дающие представление о проблемах и масштабах инициативы Е05С (хотя ряд рекомендаций 
напоминают лозунги): 

• Позиционировать Е05С как вклад Евросоюза, поддержанный открытыми протоколами, в 
Интернет РАІК данных и сервисов. 

• Действовать в предположении, что все данные в Е05С (в действительности, все ВезеагсН 
ОЬіесІз) должны быть РАІВ. 

• В области действия принципов РАІВ стандарты и протоколы должны быть ограничены 
абсолютно минимальными решениями для уменьшения риска того, что их будущее развитие 
потребует адаптации протоколов. 

• Провести быстрое прототипирование и создать эталонные реализации критических 
элементов подготовительного этапа Е05С при поддержке Ногіюп 2020 с тем, чтобы уже в 
2017 году образцы рабочих сред могли быть реализованы в ключевых дисциплинах в 
ведущих государствах - членах Евросоюза с целью их последующего распространения в 
других сообществах и странах. 

• Существующие и будущие инструменты планирования и финансирования исследований, 
включая Ногііоп 2020, должны поддерживать только те проекты, которые надлежащим 
образом относятся к вопросам организации надзора (ЗІеѵѵагсЫіір) для открытых данных. 
Проекты создания изолированных инфраструктур данных, не требующие соблюдения 
принципов РАІВ данных, не предусматривающие вклада в видение Е05С как всеобщей 
инфраструктуры для оперирования данными, не должны считаться приемлемыми для 
финансовой поддержки. 

5.2.5 Подход ЕІЮАТ к интероперабельности РАШ данных 

Для поддержки публикации данных согласно принципов РАІВ и обеспечения их 
обнаружения, доступа, интероперабельности и повторного использования, разрабатывается набор 
инструментов (РАІВ) данных, в том числе РАІВ 0а1:а Роіпі: (РРР), представляющий собой 
программный слой над наборами даных, представляющий их в виде взаимосвязываемых (іпіег- 
ІіпкаЫе) РАІВ данных [22]. РРР предоставляет информацию о доступных наборах данных с точки 
зрения их метаданных, а также обеспечивает доступ к самим данным в интероперабельном 
формате. В рамках этого пилотного проекта будет выяснено, возможно ли расширить 
функциональность существующих сервисов ЕІЮАТ функциями РРР или же необходимо разработать 
новый сервис, основанный на РРР. 

Стоит подчеркнуть, что подобный сервис будет разработан впервые, поскольку на 
сегодняшний день для широкой научной общественности нет ни одного сервиса Зетапбс ѴѴеЬ для 
поддержки репозиториев. Более того, РРР проектируется так, чтобы поддерживать цитирование 
данных и вести статистику доступа к данным, что позволит оценивать эффективность каждого 
развернутого РОР. Целью данного пилотного проекта является реализация и развертывание РРР, 
используя комбинацию существующих стандартов и каркасов Семантического Веба для разработки 
клиентской части (Ігопі-епсі) и (существующие или новые) сервисы ЕІЮАТ - для разработки 
серверной части (Ьаск-епс)). РРР обеспечивает доступ к данным и метаданных, используя ВЕ5Т-АРІ, 
соответствующих спецификации ѴѴЗС ЫпкесІ 0а1:а РІаЦогт (Платформа связанных данных). 
Функциональность, которую предоставляет РРР, расширяет возможности обнаружения, доступа, 
интероперабельности и многократного использования семантически богатых исследовательских 
данных. В первую очередь, проект нацелен на такие сервисы ЕІЮАТ, как В25а1е и В251таге. Его 


конечная цель -достичь соответствия этих сервисов требованиям РАІВ Оаіа Роіпі, придерживаясь, 
таким образом, принципов РАІВ, и предоставляя данные и метаданные в стиле РАІВ. 

По завершении проекта, ожидается демонстрация возможности образования и 
преимуществ провайдера сервисов крупномасштабных репозиториев данных подобного ЕІЮАТ, 
позволяющего представлять опубликованные наборы данных согласно принципов РАНГ Разработка 
данной инфраструктуры [22] также является частью подготовки к предстоящим требованиям 
Еигореап Ореп Бсіепсе СІоисІ. 

6. Программа реализации Е05С 

В конце 2017 года Еврокомиссия объявила о планах и финансировании реализации Е05С в 
2018 - 2020 годах. Этому предшествовал ряд действий. 

Из документов, опубликованных Еврокомиссией в 2016 г., здесь заслуживает упоминания документ 
( Ыір://еиг-Іех.еигора.еи/ІейаІ-сопІепі/еп/ТХТ/?игі=СЕ1.ЕХ%ЗА52016РС0178) , направленный в 
Европарламент 19 апреля 2016 г. для сообщения основных положений позиции Еврокомиссии по 
отношению к Европейской Облачной Инициативе: "Еигореап СІоисІ Іпіііаііѵе - ВиіІсІіп§ а сотреііііѵе 
сіаіа апсі кпо\л/ІесІ§е есопоту іп Еигоре", которые, по замыслу авторов, должны обеспечить Европе 
достойное место в глобальной экономике, движимой данными. 

26 января 2017 г. опубликован отчет о пленарном заседании Комитета Европарламента по 
промышленности, исследованиям и энергии для обсуждения Предложения Комиссии по 
Европейской Облачной Инициативе (Еигореап СІоисІ Іпіііаііѵе), требующего одобрения 
Парламентом. Более полное название инициативы звучит так: 'Еигореап СІоисІ Іпіііаііѵе - ВиіІсІіп§ а 
сотреііііѵе сіаіа апсі кпо\л/ІесІ§е есопоту іп Еигоре'. Таким образом, в комитете Европарламента 
речь шла о потенциале открытой науки и облачных вычислений как части цифровой экономики 
Европы ( Ыір://\л/ѵѵѵѵ.еигорагІ.еигора.еи/5ІсІе5/йеІРос.сІо?Іѵре=КЕРОВТ&геІ : егепсе=А8-2017- 

0006&Іапйиайе=ЕІ\І) . Это формальный документ, структура которого соответствует требованиям 
Европарламента: вначале следуют ссылки на публикации и предшествующие резолюции их 
рассмотрения в различных организациях Евросоюза, далее следуют уточнения терминов и 
предлагаемых решений, и, наконец, следуют формулировки предложений, требующих 
утверждения парламентом. Структура последнего раздела следующая: Общие предложения; 
Облако открытой науки; Совместное использование открытых и исследовательских данных; 
Извлечение информации из текстов и данных; Защита данных, фундаментальные права и 
безопасность данных. Общее число предложений в этом разделе 108. Далее в отчете следуют 
замечания и рекомендации комитетов, сформулированные ранее, и, наконец, результат 
голосования каждого из профильных комитетов (распределение голосов в ответственном за 
предмет комитете: ЗА - 46, ПРОТИВ - 7). 

Примеры предложений из раздела "Облако открытой науки": 

39. 8іге88е8 іНаІ іЬе Ореп Зсіепсе СІоисІ Іпіііаііѵе 8Нсэи 1 сі Ісасі іо а ІШ8Ісс1 СІоисІ Тог аіі: 
8сіепіІ8І8, Ьи8Іпе88е8 апсі риЫіс 8егѵісе8; 

40. Коіе8 ікаі (Неге І8 а песе88ІІу Іо Го8Ісг ап ореп, ІШ8Ісс1 соІІаЬогаІіѵе рІаіГогт Тог іНе 
тападстспі, апаіузіз, зЬагіпщ геше апсі ргезегѵаііоп оТ гезсагсН сіаіа оп ѵѵЪісЬ 
іппоѵаііѵе 8егѵісе8 сап Ье сіеѵсіоресі апсі сіеііѵсгесі и п сіе г сегіаіп 1егш8 апсі сопсііііопк; 

43. А8к8 іНе СоттІ88Іоп Іо ешиге ІІіаІ аіі 8сіепІіТіс гекеагсіі апсі сіаіа ргосіисссі Ьу ІІіс 

Ногігоп 2020 ргодгаттс І8 ореп Ьу сісТаиІІ, апсі а8к8 іИе МетЬег 8іа1е8 Іо асіарі іИеіг 





паііопаі гевеагсЪ рго§гатте§ ассогёіп§1у; 

48. \Уе1соте8 іНс Гасі іНаІ іНс Сіоисі Іпіііаііѵс Госивев оп Ьиі1ёіп§ Ні§Н-ЬапёѵѵіёіЬ пеіѵѵогкз, 
1аг§е-зса1е 8 Іо га ас Гасі 1 іііе8, НіаН-регГогтапсе сотриііп§ апё а Еигореап Ьі§ ёаіа 
есо8у8іет; 

57. 5ігс88е8 іНаІ іНс и8е о Г ореп 8іапёагё§, апё Ггее апё ореп-8оигсе 80 Й\ѵаге, аге езрссіаі 1 у 
ітрогіапі іп §иагап(ссіпа іНс песе88агу Ігап8рагепсу аЬоиІ 1ю\ѵ регзопаі апё оіНсг 
8еп8ІІіѵе Іуре8 о Г ёаіа аге іп Гасі Ьеіпа ргоіесіеё; 

67. Са1І8 оп іНс СоттІ88Іоп Іо Іаке іНс Іеаё іп ргото!іп§ іпіегзесіогаі, сго88-1іп§иа1 апё 
сго88-Ьогёсг іпІегорегаЬіІіІу апё сіоиё 8іапёагё8, апё іп 8иррогІіп§ ргіѵасу-МепёІу, 
геІіаЫе, 8есиге апё епегау-еіТісіепІ сіоиё 8егѵісе8 а8 ап іпісагаі рагі оГ а соттоп 
8ІгаІс§у і'осизіпа оп тахітІ8Іпа іНс оррог!ипіІіе8 Іо ёеѵеіор 8Іапёагё8 ІНаІ Ьаѵе іЬс 
сарасііу оГ Ьссотіпд \ѵог1ё\ѵіёе 8Іапёагё8; 

76. Зиррогіз іНс Соттіззіоп’з іпіепііоп іо гетоѵе Ьаггіегз, езресіаііу іесііпісаі апё 1е§а1 
опе8, Іо іНс і'гсс тоѵетепі оГ ёаіа апё ёаіа 8егѵісе8, іо гетоѵе а8 ѵѵеіі ёі8ргорогііопа1с 
ёаіа 1оса1І8аііоп гсс]иігстспІ8, апё іо рготоіе іНс ІпІегорегаЬіІіІу оГ ёаіа Ьу 1іпкіп§ іНс 
Еигореап Сіоиё Іпіііаііѵе іо іНс Егее Е1о\ѵ оГ Оаіа Іпіііаііѵе. 

26 октября 2017 г. Евроколлиссией опубликована декларация Е05С 
( Ыір://ес.еигора.еи/ге5еагсІі/ореп5сіепсе/іпёех.с1 : т?рй=ореп-5сіепсе-сІоиё ), начало формирования 
которой было положено на саммите Е05С 12 июня 2017 г. В этот же день опубликован Е05С 
ёесіагаііоп асііоп ІізІ, в котором, например, упоминается РАІВ Оаіа Асііоп РІап 2018 - 2020. 
Декларация содержит принципы реализации Е05С 

( Ыір://ес.еигора.еи/ге5еагсІі/ореп5сіепсе/рё1 : /ео5с ёесіагаііоп.рё1#ѵіецѵ=1і1&райетоёе=попе ), 

одобренные представителями организаций, поддерживающих декларацию (список около 100 
организаций-участников от 24 ноября 2017 г. опубликован здесь: 

Ыір://ес.еигора.еи/ге5еагсІі/ореп5сіепсе/рё1 : /1і5І оі іпзіііиііопз епёогзіпе ІІіе ео5с ёесіагаііоп. рё 

1#у1еуу=-П1&райетоёе=попе) . 

Декларация подчеркивает, что реализация ЕОБС это не проект, а процесс, по природе итеративный 
и основанный на постоянном обучении и взаимной подстройке. Декларация включает следующие 
разделы: 

• Культура данных и данные, обладающие свойствами РАІК; 

• Сервисы и архитектура организации исследовательских данных; 

• Управление и финансирование. 

Наконец, 27 октября 2017 г. опубликовано сообщение Еврокомиссии 
( Ыір^/ес.еигора.еи/гезеагсіі/рагіісірапіз/ёаіа/геі/нгого/ѵѵр/гоіз-гого/таіп/нгого-ѵѵрівго- 

іпігазігисіигез еп.рёі) о конкурсе грантов на проекты программы Н2020 по реализации 
Европейских исследовательских инфраструктур в период 2018 - 2020 г., включающем проекты 
реализации Е05С в этот же период. Начало конкурсов грантов на шесть различных проектов 
реализации ЕОБС разнесены по времени с 5 декабря 2017 г. до 14 ноября 2018 г. Оеаёііпез для 
подачи предложений соответственно разбросаны по времени с 22 марта 2018 г. до 20 марта 2019 
г. Бюджеты этих проектов определены. Суммарный объем финансирования составляет 142 
миллиона евро в 2018 г., 45.5 миллионов евро в 2019 г. и 84 миллиона евро в 2020 г. Максимальное 
время для подписания соглашения по гранту - 8 месяцев от ёеаёііпе для подачи предложения. 








Меньше всего информации имеется по третьему проекту из шести. Известна только тема проекта и 
то, что он начнется в 2020 году: 

ІМРРАЕ05С-03-2020: ІпІе§гаІіоп апсі сопзоіісіаіііоп сР рап-Еигореап ассезз тесІтапі5т5 іо риЫіс е- 
іпігазігисіигез апсі соттегсіаі зегѵісез ІІігои§Іі 1:Ие Е05С ИиЬ 

Ввиду того, что этот проект ориентирован на применение работающего Европейского облака, такое 
обособленное отношение к нему представляется оправданным. 

Далее следует краткая аннотация проектов, по которым имеются определения их содержания в 
сообщении Еврокомиссии от 27 октября. 

ІМРРАЕ05С-01-2018: Ассезз Іо соттегсіаі зегѵісез 1:Игои§И Иге Е05С РшЬ 

Два вида сервисов должны быть рассмотрены: а) товарный тип коммерческих цифровых сервисов 
необходимых в междисциплинарных исследовательских делах, включающий, например, облачные 
сервисы (хранения, вычислений, приложений), софтверные лицензии, симуляционный 
инструментарий, тулы виртуализации и поддержки совместной деятельности; б) различные виды 
коммерческих сервисов данных (космической и земной природы); например, коммерческие 
сервисы наблюдения Земли из космоса, включающие прежде всего предоставление информации, 
основанной на открытых данных проекта Коперник, доставляемых при помощи платформ 'РІАБ' и 
ее умной интеграции в каталог сервисов Е05С. 

При этом необходимо опираться на анализ, определяющий как различные нужды исследователей 
могут быть агрегированы с дополнительными коммерческими сервисами для максимизации 
вклада от инструментария уже представленного каталогом сервисов Е05С для поддержки 
междисциплинарных исследований. Кроме того, нужно обеспечить техническую интеграцию 
коммерческих сервисов в каталог сервисов Е05С, включая управление правами доступа и 
установление приемлемых правовых соглашений, а также определение надлежащих соображений 
по использованию сервисов и их интероперабельности. 

Следует также понимать, что новая панъевропейская модель исследовательских данных и сервисов 
должна быть создана на основе Е05С хаба (панъевропейского механизма доступа к сервисам, 
предоставляемого на национальном, региональном или институциональном уровне). Любопытно, 
что в сноске на стр. 15 сказано, что механизм Е05С хаба будет основан на предложении, 
ожидающемся от проекта, который победит на конкурсе ЕІІМРВА-12-2017. 

ІМРРАЕ05С-02-2019: РгоІоІуріп§ пеѵѵ іппоѵаііѵе $егѵісе$ 

На основе возможностей хаба Е05С, инновационные сервисы должны быть созданы с тем, чтобы 
учитывать релевантные аспекты цикла исследовательских данных (от начального состояния до 
публикации, курирования, сохранения и повторного использования). Подчеркивается 
эволюционный характер создания инновационных сервисов (сначала они могут удовлетворять 
потребностям конкретного научного сообщества, но к концу проекта они должны удовлетворять 
требованиям междисциплинарного исследования). Аналогичная эволюция допускается в 
отношении ТВІ_, который должен быть к концу проекта не ниже 8 для систем и технологий, 
используемых предлагаемыми сервисами. Также рекомендуется использовать предложения 
проектов-победителей конкурса ЕІІМРКА-12-2017, относящиеся к хабу Е05С. 

ІІМРРАЕ05С-04-2018: СоппесІіп§ Е5РКІ Іп1га$1гис1иге5 ІІігои§Іі Сіизіег ргоіесіз 



В рамках этой тематики следует использовать кластеризацию проектов и вех Е5РКІ в следующих 
областях исследований: Биомедицинские науки; Окружающая среда и науки о Земле; Физика и ее 
средства аналитики; Социальные и гуманитарные направления; Астрономия; Энергетика. Каждая 
инфраструктура должна участвовать только в одном кластере. Предложения должны включать 
подходы к обслуживанию данных во включаемых инфраструктурах следуя принципам РАІК 
согласованно с целями Открытой Науки. При этом должны рассматриваться определения 
специфических для каждой области политик данных, вопросов интероперабельности и права, 
которые влияют на трансграничное оперирование данными в рамках географических и 
тематических границ. Предложения должны рассматривать вопросы синергетики и 
дополнительности при оперировании данными между различными инфраструктурами, включая 
проблемы интеграции и интероперабельности данных в Е05С. 

Предлагаемые консорциумы должны включать ключевых участников вовлеченных инфраструктур 
и их правовые подразделения. Ожидаемое влияние проекта должно включать область целей 
Открытой Науки, охватывая такие вопросы как междисциплинарную открытую инновационную 
среду для поддержки данных, знаний, сервисов, образование глобальных стандартов, онтологий и 
интероперабельности научных данных, принятие общих подходов к жизненному циклу управления 
данными, и др. 

ІМРРАЕ05С-05-2018-2019: Биррогі: Іо ІІте Е05С Ооѵегпапсе 

Главной целью этих проектов является создание операционной структуры для поддержки 
всеобъемлющего управления Е05С, включая координацию релевантных национальных инициатив. 
Операционная структура представлена тремя направлениями (каждое из которых будет 
поддержано отдельным подпроектом): 

1) Обеспечение координационной структуры для поддержки деятельности Исполнительного 
Совета Е05С, отвечающего за реализацию Е05С. В этом направлении выделяются деятельности по 
Координации и Поддержке. Перечислены в общем виде предполагаемые виды действий (включая 
поддержку процессов принятия решений при реализации ключевых функций Е05С; поддержку 
создания инновационных моделей внедрения таких функций; набор методов и правил для 
использования сообществами пользователей, провайдеров инфраструктур для совместного 
проектирования и внедрения облачных решений и сервисов, доступных конечным пользователям 
при помощи хаба Е05С; обеспечение заключения соглашений со странами, не входящими в 
ЕвроСоюз, относительно политики и технологических разработок, совместимых с Е05С). 

2) Координацию различных национальных инициатив/инфраструктур данных/е-инфраструктур и 
их федерализации в составе Е05С. В этом направлении (в него включаются Исследовательские и 
Инновационные Деятельности), наряду с его детализацией, рекомендуется при развитии 
стандартов сервисов и интероперабельности на различных уровнях использовать документ 
"Еигореап ІпІюгорегаЬіІііу Ргатеѵѵогк - ІтрІетеп1:а1:іоп Бігаіеёу", принятый в марте 2017 г. Этот 
документ связан с другим большим изданием Еврокомиссии, озаглавленным "№ѵѵ Еигореап 
ІпІегорегаЬіІіІу Ргатеѵѵогк" (І5ВМ 978-92-79-63756-8; сіоі:10. 2799/78681). 

3) Стимулирование культуры обращения с данными РАІВ и внедрение достойных практик, 
придающих данным свойства РАІК. В предложениях рекомендуется опираться на координацию 
глобальных инициатив (указаны ОО-РАІК, а также сообщества ССЮАТА, РША, \ЛЮ5), а также 
инициатив в странах Евросоюза или ассоциированных с ним. Кроме того, рекомендуется развивать 



Европейский каркас компетенции в сфере сіаіа зсіепсе путем его представления в академических 
куррикулумах (подобно проекту Е0І5ОІМ). 

ІІМРКАЕ05С-06-2019-2020: ЕпІіапсіп§ іЬе Е05С рогіаі апсі соппесбп§ {бетаИс сіоисіз 

Основная задача проекта - поддержка портала Е05С. Эта тема ориентирована на обеспечение 
полнофункционального, устойчивого и полного пользовательского интерфейса, который мог бы 
служить в качестве универсальной точки входа для сервисов Е05С. Предложения рекомендуется 
базировать на результатах проекта еІпІтаСепІтаІ и обеспечить дополнительную поддержку 
реализации хаба Е05С для окончательного формирования и оптимизации функций и интерфейсов 
портала Е05С. Ожидаемые проблемы связаны с необходимостью обеспечения открытой среды для 
пользователей, ведущих исследования в произвольных научных областях вдоль всего жизненного 
цикла научных данных. 

Дополнительная информация, имеющая отношение к программе реализации Е05С, приведена 
далее. Заметным является повышение плотности событий. 

Список исследовательских инфраструктур, связанных с Ногіюп 2020 и предоставляющих свободный 
доступ к данным, опубликован в феврале 2017 г. в документе «КезеагсН Іпітазігіісііигез оДегіп§ Дее 
Ассезз ѵѵіііі ЕІІ зиррогі:». Список включат проекты в следующих областях: Биомедицинские науки; 
Окружающая среда и науки о Земле; Физические науки; Социальные и гуманитарные направления; 
Энергетика; Материальные науки и средства аналитики; Математика и ІСТ. 

В мае 2017 г. в 27 выпуске новостного издания Іпзрігес), издаваемого ЕСІ сообществом ( ѵѵѵѵѵѵ.ейі.еи) , 
наряду с представлением сервисов ЕСI для открытой науки, анонсирован двухлетний пилотный 
проект ( Ыір://ео5сріІо1:.еи/) , предназначенный для формирования оснований Е05С, в котором 
участвуют 33 Европейских партнера. В июне 2017 г. ЕСІ консорциум опубликовал брошюру ЕСІ ЕІзе 
Сазез. В ней наряду с описанием интересных примеров применений инфраструктур данных в науке 
кратко описано ЕСІ Ресіетаіесі СІоиб, которое объединяет приватные академические облака и 
виртуализованные ресурсы на основе открытых стандартов. Основным является абстрактный СІоисІ 
Мапа§етеп1: Ргатеѵѵогк, поддерживающий множество облачных интерфейсов. 

В ноябре 2017 г. ЕСІ консорциум опубликовал брошюру «ЕСІ зиррогі: Рог ВезеагсЬ ІпДазДисРигез» 
( ЬДр5://ѵѵѵѵ\/ѵ.ейі.еи/\/ѵр-сопРепР/ирІоасІ5/2017/11/ЕСІ-КІ5.рсіР ), содержащей аннотации избранных 
проектов из 31 исследовательских инфраструктур, поддерживаемых ЕСІ, примеров совместных 
проектов в областях РІауки об окружающей среде (5 проектов); Гуманитарные исследования (1 
проект); Физика и астрономия (2 проекта); Биомедицинские науки (4 проекта). ЕСІ представляет 
собой федерацию из 300 центров данных и вычислений (полный список центров данных 
содержится здесь: е§і.еи/Ресіега1:іоп/сІа1:а-сеп1:ге5/) и 21 облачных провайдеров. Полный список ЕСІ 
сервисов можно найти здесь: §о.е§і.еи/ех1:, §о.е§і.еи/іп1: и ШрзѴ/ѵѵѵѵѵѵ.ейі.еи/зегѵісез . 

В то же время ЕСІ выступил с одобрением декларации ЕОБС ( Ыірз^/ѵѵѵѵцѵ.ейі.еи/пеѵѵз/ейі-епсіогзез- 
Ніе-еозс-сіесіагабоп/ ). Информация о поддерживаемых ЕСІ инфраструктурах и некоторых 
проблемах реализации ЕОБС (включая создание РАІВ сервисов и хаба Е.І5С) содержится в 
материалах конференции ЭІ4В ( Ьі1рз://ѵѵѵѵ\/ѵ.ейі.еи/пе\/ѵ5/ейі-І'іійІ'і1ійІ'і1:5-а1:-сіі4г-2017/ ). 

В январе 2018 г. ЕІЮАТ организует конференцию "РиШп§ Ібе ЕОБС ѵізіоп іпіо ргасбсе", программа 
которой содержится по адресу: ( Ы:1:р5://еисіа1:.еи/еисІа1:-соп1 : егепсе-2018-ргойгатте ). 










7. Проект «Национальный сервис данных» (N05) в США 

Национальный сервис данных (№1:іопаІ Оаіа Бегѵісе, N05), разрабатываемый в настоящее 
время в США, должен обеспечить стандартный набор услуг для хранения, совместного 
использования, публикации, размещения и верификации данных во всех дисциплинах и 
сообществах, однако, он должен быть построен над существующими инфраструктурами, уже 
используемыми соответствующими сообществами. N05 функционирует как консорциум (в 
соответствии с уставом [23]), разрабатывающий открытую среду распределенных, 
интероперабельных и интегрированных сервисов национального масштаба. В соответствии с этим 
подходом, N05 берет на себя ответственность адаптировать существующие или разработать 
необходимые новые сервисы, сосредоточившись на следующих пяти ключевых услугах: 

• обанаружение данных, созданных или хранимых учеными или исследователями;хранение 
постоянных копий курируемых данных и связанных с ними метаданных для архивирования, 
совместного использования, публикации и других целей; 

• доступ к данным при помощи репозиториев и других мест их хранения; 

• связывание данных с другими данными, их публикациями, а также возможность повторного 
использования; 

• обработка и анализ данных для развития науки, линий поведения и инноваций. 

Устав N05 [23] является руководством по управлению операциями N05 и Консорциума 
Национального сервиса данных (№1:іопаІ 0а1:а Бегѵісе Сопзогбтшп, Ы05С). Если Национальный 
сервис данных - это организация, предоставляющая совокупность услуг, то Консорциум 
Национального сервиса данных - это более широкое сообщество заинтересованных лиц, 
включающее физических и юридических лиц. 

По сравнению с ЕОБС, N05 представляется более индустриальным проектом: здесь (может 
быть, пока) нет стремления к введению семантических метаданных для поддержки принципов 
РАІВ. Поэтому важным компонентом N05 является N05 ЬаЬз, который рассматривается, как "игровая 
площадка" для оценки, разработки и интеграции технологии управления данными. Это среда, где 
разработчики могут проектировать инструменты и тестировать новые возможности, используемые 
при создании каркаса и сервисов N05. Среда предоставляет быстрый доступ к инкапсулированным 
средствам и сервисам управления данными таким образом, что они могут быть быстро развернуты 
с целью оценки или разработки. Она позволяет разработчику или небольшой команде 
разработчиков проверять новые идеи, проектировать новые сервисы или объединять 
существующие приложения как часть создания экосистемы N05. Таким образом, просто проводить 
следующие операции: 

• Выполнять хостинг сервисов 

• Получать доступ к эластичным вычислительным ресурсам (виртуальным машинам) 

• Получать доступ к хранилищам данных 

• Находить доступные средства и сервисы управления данными 

• Сравнивать и проводить оценку различных технологий 

• Разворачивать тестовые экземпляры программ 

• Выполнять облачную разработку ПО 

• Публиковать/предоставлять для совместного использования инструментов одних 
разработчиков другими участниками проекта. 



Кролле этого, N05 І_аЬ предоставляет оборудование для выполнения пилотных проектов, а 
также обеспечивает совллестную поддержку деятельности по разработке програллллного 
обеспечения. Персонал, обеспечивающий поддержку коллабораций, работает с проекталли 
киберинфраструктур данных таких организаций, как МБР, NIН, N151, РОЕ и др., и готов предоставить 
свой опыт и знания в области технологий обработки и анализа данных для поддержки разработки 
в раллках различных пилотных проектов. 

Перечень технологических коллпонентов МБР, взятых из различных програлллл МБР (таких как, 
ОІВВз, ОаІаМеІт ЕагШСиЬе) представлен в таблице на веб-странице [24]. Строки этой таблицы 
содержат гиперссылки на соответствующие коллпоненты, а столбцы соответствуют функциялл, 
которые разрабатываютя N05. Значения в ячейках соответствуют степени использования функции: 
Роіепііаі - потенциально рассматривается к использованию в N05, СиггепІІу- в настоящее врелля 
ведется реализации функции в N05, ІЛІІІіесІ - функция полностью реализована в N05 США. 

На сайте СІМЕКСІ проекта ЕагШСиЬе ( Ніір5://\ллллл/.еагіІтсиЬе.огй/ЕГоир/сіпегеі) 
содержатся различные ссылки, касающиеся проблелл интероперабельности в области наук о Зеллле, 
с которылли часто сталкиваются при поиске и интерпретации ллеждисциплинарных данных, 
полученных из различных источников. СІМЕВСІ лложет снизить нагрузку при поиске, интерпретации 
и оценке пригодности к использованию различных типов инфорллационных ресурсов из различных 
областей наук о Зеллле. В раллках ряда проектов из области наук о Зеллле - по геохиллии, гидрологии, 
океаническилл исследованиялл, экологии и другилл областялл - были созданы теллатические 
хранилища данных и каталоги ллетаданных. СІ NЕКСI позволяет получить к нилл доступ через единый 
стандартизованный интерфейс и улучшает описания ллетаданных, чтобы сделать процесс поиска 
данных более единообразнылл и лленее вреллязатратнылл. Веб-страница N05, относящаяся к 
технологиялл ЕагШСиЬе 

( Ьі:1:р5://па1:іопаІсІа1:а5егѵісе.а1:Іа55Іап.пе1:/\л/ікі/сІІ5рІаѵ/М РЗС/ЕагІіИСиЬе+Т есИпоІо^у+Сотропе 

піз), содержит следующий список возлложностей, относящихся к ллетаданнылл, которые, вероятно, 
поддерживаются СІМЕВСІ: 

• Каталоги и регистры 

• Интероперабельные кросс-дисциплинарные онтологии 

• Средства для исследования, валидации, проверки и отображения данных 

• Брокерные сервисы данных (ллетаданных), позволяющие переходить от одного стандарта к 
друголлу 

• Брокерные сервисы интерфейсов, управляющие доступолл к даннылл в различнолл форллате и 
через различные протоколы 

• Прилленение социальных сетей на профессиональнолл уровне для поддержки обллена 
знаниялли ллежду различнылли группалли ученых в области инфорллационных технологий и 
наук о Зеллле. 

8. Альянс создания социальных и технических инфраструктур поддержки 

открытого совместного доступа к исследовательским данным (ІША) 

Альянс исследовательских данных (РША) был образован для поддержки совллестного 
использования данных сквозь барьеры в 2013 г. Ядро организаторов включало Европейскую 
коллиссию, МабопаІ Бсіепсе Роипсіаіііоп, N151, Министерство инноваций Австралии. К ноябрю 2016 г. 
число членов альянса достигло 4500 из 115 стран. В раллках альянса образовано большое число 
рабочих групп и групп по интересалл. Поллилло разработки и принятия инфраструктурных решений, 





в задачи ВРА входит ускорение роста сплоченного сообщества, объединяющего спонсоров в рамках 
конкретных областей исследований, национальных, географических и возрастных границ. Дважды 
в год организуются пленарные совещания РЮА в различных местах мира. Например, в марте 2015 
г. на совещании в Сан-Диего рассматривались крупномасштабные инфраструктурные проекты 
организации и анализа данных (включая ЕІЮАТ, ОаЕаОпе, СІ_АВІІ\І, 5ирегсотриЕіп§ апсі Ві§ РаЕа, 
ЕЫХІК, N05 и др.). 

В качестве примера результатов ВРА, связанных с настоящим обзором, дана ссылка на 
работу, которую ВйА ведет по стандартам и моделям метаданных в различных ОИИД [25]. Целью 
этой работы является создание открытого справочника стандартов метаданных, применимых к 
научным данным, для использования при создании и анализе разнообразных инфраструктур. В 
редакции этого справочника на конец 2016 г. включены следующие разделы: АгЕ$ апсі НшпапіЕіез, 
Еп§іпеегіп§, и Ее Бсіепсез, РЕіузісаІ Бсіепсез апсі МаЕІгетаЕісз, БосіаІ апсі ВеЕіаѵіогаІ Бсіепсез, СепегаІ 
Везеагсіі ОаЕа. Пример одного из стандартов: Соге БсіепЕіЕіс МеЕасІаЕа МосіеІ (С5ІѴЮ) [26]. Он 
обобщает ряд научных дисциплин, особенно тех, которые можно отнести к «структурированным 
наукам» (таким как химия, материаловедение, науки о Земле, биохимия). Модель, лежащая в 
основе этого стандарта, организована вокруг понятия «исследование», в рамках которого 
проводится ряд экспериментов, наблюдений, анализов, симуляций, и пр. С5ІѴЮ ориентирован на 
поддержку данных в рамках потоков работ. Модель ориентирована на иерархию структуры 
научного поиска: программы, проекты, исследования. Вот гиперссылки на документы, 
сопровождающие С5ІѴЮ: А зИогІ: іпЕгобисЕіоп Іо С5МР , СБМР 4.0 ВеЕегепсе РоситепЕ (НТМр, СБМР 
ОУУЬ ОпЕоіойѵ іп ВРГ ТигЕІе ЕогтаЕ, С5МР 4.0 ВеЕегепсе РоситепЕ (РРР). 

9. Примеры методов и средств концептуализации конкретных 
предметных областей 

Астрономия. В рамках международного альянса виртуальной обсерватории (ІѴОА) 
развиваются подходы концептуализации предметной области астрономии и использования её в 
спецификациях, связываемых с данными. Большинством астрономического сообщества 
используются подходы к аннотированию атрибутов баз данных и каталогов неформальными 
семантическими спецификациями. До сих пор наиболее распространена специализированная 
система классификации на основе универсальных концептуальных дескрипторов (ІІСР), не 
гарантирующая однозначной интерпретации спецификаций машиной и человеком. Модели 
общеупотребимых областей, таких как фотометрия (РЕюЕРМ) и астрометрия (5ТС), называемые 
«моделями данных», также используются не в качестве схем для представления данных, а для 
аннотирования данных в их оригинальной структуре с помощью указания пути до элемента в схеме, 
соответствующего семантике атрибута. Смысл каждого элемента схем определён вербально. 
Существует также несколько известных онтологий, созданных на основе словарей, однако 
используются они на практике редко. В рамках настоящего проекта проведены исследования по 
концептуализации предметной области с использованием формальных онтологий и объектных 
концептуальных схем и показано преимущество повторного использования этих средств при 
решении различных задач [27]. Для передачи данных и метаданных широко используется формат 
РІТ5, включающий в себя возможность одновременной сериализации изображений, табличных 
данных и метаданных с набором параметров. Помимо этого, используются ХМЕ-форматы описания 
явлений (ѴО ЕѵепЕ) и табличных данных (ѴОТаЫе). Обеспечение астрономии данными во многом 
возложено на консолидацию зеркал обзоров, каталогов и баз данных в сервисах под 
унифицированными интерфейсами (АРБ, ВРВ, ІІМЕ5, 5ІМВАР, ѴізіеВ, ѴАБР, ѴѴЕРРВ). Современные 
требования к масштабируемости обработки данных приводят к выводам о необходимости 





локализованной обработки в местах расположения данных и использования инфраструктур 
исследовательских данных. 

Материаловедение. Особенностью предметной области материаловедения является 
акцент на выражении физических свойств материалов в связи с их структурными особенностями. В 
данной области наработаны подходы к созданию хорошо структурированных концептуальных 
спецификаций, которые используются для представления и передачи знаний о материалах. Одним 
из распространённых средств спецификации свойств материалов является язык МаШЬ, 
определяющий ХМЬсхему для описания химических, механических, термальных свойств 
материалов. Отмечалось, что данный язык не имеет чётких определений элементов. Однако для 
совместного использования с МаШІ. созданы онтологические спецификации Маіегіаіз Оп1юІо§у, 
которые связывают с языком определённую семантику. Онтология определена на языке ОѴѴЦ для 
описания метаданных используется язык КОР [28]. 

Науки о Земле. В науках о Земле объединяется множество связанных друг с другом ОИИД. 
В исследовании распространены как подходы анализа данных наблюдений, так и моделирования 
явлений. Необходимость в концептуальном осмыслении такой широкой области знаний ставится 
во главу угла давно. Однако средства концептуального описания, в основном, заимствовались из 
словарей и не имели достаточно формального описания (например, онтология 5ѴѴЕЕТ). Инициатива 
ОеоБетапбсз в рамках инфраструктуры данных ЕагІІіСиЬе направлена на преодоление 
семантической неоднородности наработанных моделей и коллекций данных. Она представляет 
каркас для аннотирования и интеграции информационных ресурсов, основанный на технологиях 
открытых данных, и реализует сервисы работы с интегрированными неоднородными 
контролируемыми словарями (КІ5), семантического аннотирования ресурсов (5А5) метаданными 
пространственно-временного контекста и происхождения, семантического поиска ресурсов (Ш5) и 
потока работ (КА5) для согласования атрибутов разных информационных ресурсов [29]. 

10. Определение и$е сазез для решения задач, требующих совместного 
использования данных из инфраструктур Европы и России, в конкретных 
ОИИД 

Мотивация подготовки изе сазез и требования к их описанию заключаются в следующем: 

• Необходимы аннотации изе сазез, ориентированные не столько на специалистов в 
конкретных ОИИД, а на использование архитекторами систем при создании ими новых 
инфраструктур поддержки ореп зсіепсе и совместного доступа к данным. Образец изе сазе 
содержит сценарий решения задачи, показывающий шаги решения, данные и сервисы, 
используемые на каждом шаге. К этому следует добавить ссылки на конкретные коллекции 
данных или на проекты проектируемых инструментов их получения, а также краткие 
пояснения функций сервисов. 

• Важно, чтобы в каждом изе сазе была показана целесообразность совместного доступа к 
данным в коллекциях России и в Европейских проектах исследовательских инфраструктур, 
планируемых к завершению в начале 20х годов 21 века. 

• Нужно показать, что наши задачи потребуются после 2020 г. для проведения исследований с 
данными, которые будут производиться тогда. При этом существенно показать, что в России 
также будут данные, которые могут быть полезными для использования в Европейских 
исследованиях. 

• Предлагаемые задачи должны быть ориентированы на перспективу (прежде всего заданием 
данных, которые будут актуальны после 2020 г.). Они должны показывать, что Европейские 


программы о переходе к ореп зсіепсе, к созданию соответствующих инфраструктур (типа 
Е05С), обеспечивающих совместный доступ к данным, к введению новых инструментов для 
получения данных очень важны для России. 

Далее следуют описания изе сазез, подготовленные участниками проекта, в 2016 году. 

Астрономия 

АІ. Поиск компонент астрофизических транзиентов различной природы 

В общем случае задача формулируется и может быть формализована как задача поиска и 
исследования всех обстоятельств, сопровождающих астрофизические транзиенты. К классу таких 
событий относятся, по крайней мере, космические гамма-всплески (СРВ), быстрые радиовсплески 
(РВВ), одиночные нейтрино высоких энергий (ІсеСиЬе зоигсез), всплески гравитационного 
излучения (6ѴѴ). СРВ регистрируются космическими обсерваториями БѵѵіД (Сеітгеіз еі аі. 2004), 
Регті (Мее§ап еі аі. 2009), І[\ІТЕ6ВАІ. (ѴѴІпкІег еі аі. 2003) и в будущем - 5ѴОМ (6612 еі аі. 2009). 
Точность локализации СРВ составляет от нескольких угловых минут до нескольких градусов. СѴѴ 
детектируются наземными экспериментальными установками 1.160 (б11р5://ѵѵѵѵ\/ѵ.ІІ§о.саІ1есб.есІи/) 
и Ѵіг§о (Ьі1р://ѵѵѵѵ\/ѵ.ѵіг§о-§\/ѵ.еи/). Точность локализации составляет сотни квадратных градусов. 
Источниками рассылки сообщений в режиме реального времени о произошедших событиях 
является платформа ВАССЮІЫЕ (Ьир://§сп.§5Іс.паза.§оѵ/ітргоѵетепІ5.Ьі:тІ). Исследование 
обстоятельств, предшествующих, сопровождающих и следующих за транзиентным событием 
состоит в поиске компонент события в различных диапазонах электромагнитного излучения (1) в 
режиме реального времени, (2) дополнительных наблюдениях и (3) в поиске в архивных данных. 

1. Для всех транзиентов, производится наблюдения областей локализации в оптическом и 
радиодиапазонах наземными телескопами с целью поиска новых точечных транзиентных или 
переменных источников. В России - это сети телескопов МАСТЕР, ИСОН и ИКИ РАН. Значимость 
результатов работы этих сетей увеличивается со временем, результаты сообщаются в публикациях 
реально времени (Ы:1:р://§сп.§5І : с.па5а.§оѵ). Наблюдения вводимого в строй обзорного телескопа 
АЗТ-ЗЗВМ (ИСЗФ, Россия, п. Монды) с апертурой 1.5м и широким полем зрения будут востребованы 
при поискетранзиентов. 

2. Дополнительные наблюдения необходимы для целенаправленного всестороннего 
исследования, такие наблюдений проводятся сетью ИКИ РАН и телескопами САО РАН 
(ЬИр5://\ллл/\л/.зао.ги/). Как правило, это глубокие повторяющиеся наблюдения одной и той же 
области. Они необходимы для исследования свойств послесвечения, сверхновой, родительской 
галактики. Архивные данные наблюдений телескопами САО (Цейс-1000 и БТА) доступны. 

3. Важной задачей поиска всех обстоятельств транзиентов является исследование архивных 
данных (3.1) совпадающих во времени с началом транзиентного события и (3.2) исследования 
места локализации точечного источника, полученных до, во время и после транзиентного события. 

3.1. Производится поиск всплеска излучения в других экспериментах, в частности, в данных 
всенаправленных космических гамма-детекторов (БРІ-АСБ/ІЫТЕбКАЦ Копиз-ѴѴІпсІ, 
БДРГ/Ломоносов). База данных Большой Сканирующей Антенны (БСА, Пущино, 
Ьі1р://ѵѵѵѵ\/ѵ.ргао.ги/гасііо1:еІе5Соре5/іп_ІІ5І:_В5А.Іі1:тІ) для радиодиапазона 110 МГц является 
источником поиска радио-транзиентов, сопровождающих 6ВВ и 6ѴѴ, в настоящее время есть 
ограниченный доступ к базе данных. 


3.2. Исследование места локализации точечного источника в архивных данных позволяет 
уменьшить объем дополнительных наблюдений. Исследование проводится в каталогах и исходных 
данных каталогов - изображений. Наиболее востребованный каталог для исследований свойств 
родительских галактик - 5055 (Шр://\л/\л/\л/.$сІ55.ог§/). Кросс-корреляция различных каталогов 
позволяет выделить калибровочные звезды, необходимые для проведения фотометрии 
оптических транзиентов. Несколько российских экспериментов могут быть самостоятельным 
источником сообщений об обнаружении транзиентов в реальном времени. БСА может быть 
источником сообщения о радио-транзиентах типа РВВ. Реализация выделения высокоэнергичных 
нейтрино в режиме реального времени на установках Баксанской Нейтринной Обсерватории (БНО, 
Ы;1;р://\л/\л/\л/. іпг .ги/ гиз/Ьпо/ІЬрзі;. Ы;тI) может быть самостоятельным источником сообщений. База 
данных БНО для архивного поиска нейтрино от источников СКВ и С\Л/ (3.1). В сети МАСТЕР 
реализована отправка сообщений об оптических транзиентах различной природы. Несомненно, 
строящийся обзорный телескоп І.55Т ( ЬНр5://уѵѵуѵѵ.і55і:.огй/ ) станет основным источником 
оперативных сообщений об оптических транзиентах, а также неисчерпаемым источником архивных 
данных. 

А2. Исследование астрофизических характеристик звёзд и межзвёздной среды 
по фотометрическим данным 

Оценка таких астрофизических параметров, как температура, радиус, масса, металличность, 
ускорение силы тяжести для звёзд нашей Галактики требует использования данных об их спектрах 
в широком диапазоне излучения. Данные о спектрах большинства наблюдаемых звёзд 
восстанавливаются по фотометрическим данным, снятым во всех возможных диапазонах от радио 
до ультрафиолетового. Потоковые и обновляемые данные многополосной фотометрии, 
получаемые от современных инструментов 5055, 1.55Т (с 2021 г.), ІІКЮ55, Рап-5ТАВВ5 (США, Европа), 
охватывают сведения о блеске звёзд в оптическом и ближнем инфракрасном диапазонах. 
Исторические данные за всё время наблюдения из каталогов САБЕХ, 2МА55 дополняют их 
фотометрическими наблюдениями в инфракрасном и ультрафиолетовом диапазонах. Выборки 
данных перечисленных обзоров и каталогов, связанные с определёнными участками неба, 
получаются через сервисы ѴіііеВ и МА5Т и передаются в локальные центры обработки данных, где 
применяется сервис кросс-отождествления источников излучения в различных диапазонах 
(например, сервис 5АІ СА5, Россия). Далее необходимо оценить степень переменности звёзд по 
множественным наблюдениям в одних и тех же диапазонах в разные эпохи, а также на основании 
присутствия звёзд в базах данных переменных звёзд ОКПЗ, ААѴ50 (Россия, США) и др. Эти данные 
также перемещаются в соответствующие локальные центры и отождествляются с присутствующими 
фотометрическими данными. Таким образом, собираются фотометрические данные (до 15 полос) 
о блеске отождествлённых звёзд. Затем для параметризации звёзд используются результаты 
моделирования эволюции звёзд, рассчитанные программными комплексами РАВ5ЕС, СОЫВКІ, Ѵ2 
(Европа, США), и звездных атмосфер, например, рассчитанных комплексом АИА59 (США). В 
частности, данные расчётов собираются в 5ѴО ТЬеогеІісаІ Бегѵісез (Испания) и могут пополняться за 
счёт библиографического поиска АР5 и агХіѵ. Сервис, реализующий методику параметризации 
звёзд (ИНАСАН, Россия), использует собранные данные фотометрии для всего множества звёзд и 
данные моделирования спектров и оценивает параметры звёзд (включая расстояние до них) и 
межзвёздной среды. Результаты работы сервиса параметризации поступают в репозитории с 
каталогом астрофизических параметров звёзд и трёхмерной картой межзвездного поглощения. 
Точность работы сервиса параметризации звёзд по многополосной фотометрии оценивается 
сравнением с данными спектроскопических обзоров 5ЕСЕІЕ, БЕСЕІЕ (США, Китай) и картами 
межзвёздного поглощения, включая разработанную для европейского космического эксперимента 



Ніррагсоз (Агепои еі аі, 1991). Таким образом, результатом работы комплекса станут каталог звёзд 
с астрофизическими характеристиками и расстоянием до них, списки объектов, не поддавшихся 
параметризации (вероятные кандидаты в новые классы объектов), и карта зависимости 
межзвездного поглощения от расстояния в различных направлениях. Эти данные используются для 
решения множества других задач, в частности, для уточнения параметров ускоренного расширения 
Вселенной. Данные карты межзвёздного поглощения в направлениях известных сверхновых 
перемещаются в центр обработки данных. На основании этих данных производится усреднённая 
минимальная оценка поглощения средой до сверхновых, а это позволяет уточнить плотность 
тёмной энергии, ответственной за ускоренное расширение Вселенной. 

Неорганическая химия и материаловедение 

НХМ 1. Термоэлектрические материалы для прямого преобразования тепла в 
электричество 

В следующем десятилетии в связи с уменьшением запасов углеводородов и роста 
загрязнения окружающей среды особенно остро станет проблема «чистой» энергетики. Один из 
путей решения проблемы - использование термоэлектрических генераторов энергии, 
предназначенных для прямого преобразования тепла в электричество (Бпусіег С. .1. ТГіегтоеІесІгіс 
Епег§у Нагѵе5Ііп§, іп "Епегду Нагѵезііпд ТесНпоІодіез". ЕсІ. Ьу Б.Ргіуа. 5ргіп§ег. 2009. Р.325-336). 
Основным активным компонентом таких генераторов являются термоэлектрические материалы 
(ТЭМ). 


Для выбора ТЭМ с широким набором заданных свойств (высокими коэффициентом термо- 
ЭДС и КПД, широким интервалом рабочих температур, низкой стоимостью, технологичностью в 
производстве, малой токсичностью, хорошими механическими свойствами и т.д.) необходимо 
провести поиск информации во множестве баз экспериментальных данных: 

• термоэлектрические свойства - БД N151 ІТБ-90 ТЬептюсоирІе ОаІаЬазе 
(Іг11р5://$г<1а1а.пі$1.§оѵ/і1:590/таіп/), Бргіп§егМа1:егіаІ5 (бМр://та1егіаІ5.5ргіп§ег.сот/) и БД, 
разработанная в Калифорнийском (Санта-Барбара) и Гарвардском университетах; 

• токсичность - БД СГіетісаІ Баіеіу ОоситепБз (5ргіп§егМа1:егіаІ5); 

• механические свойства - БД Бргіп§егМа1:егіаІ5 

и электронных коллекциях публикаций (ЭКП) (ЕІзеѵіег ( ШрѴ/ѵѵѵѵѵѵ.зсіепсесІігесІ.сот ). ѴѴІІеу 
( Ьі1р://уѵѵуѵѵ.іп1ег5СІепсе.\/ѵіІеѵ.сот) . 5ргіп§ег ( Ы:1:р://\л/\л/\л/.5ргіпаегІі пк.сот/), АС5 

( Ыі:р://риЬ5.ас5.огй) , ТауІог&Ргапсіз ( Ь»р://уѵѵѵ\/ѵ.1апсІ1опІіпе.сот) и т.д.). В случае отсутствия 
экспериментальных данных будет проводиться поиск результатов в базах расчетных данных 
(например, в Маіегіаіз Епсусіоресііа, разрабатываемой в рамках ЫоМай (Ы:1:р://потасІ-ІаЬ.еи/), 
СотрЕБ (ЬМр://сотре5-х.піт5.§о.]р/іпсІех_еп.ЬітІ) и т.д.). В случае отсутствия последних, если это 
возможно, будет проведен расчет необходимых свойств с использованием квантовомеханических 
пакетов, например, ѴА5Р (ГіирзУ/ѵѵѵѵѵѵ.ѵазр.аІ:), СА5ТЕР (Шр://\ллллл/.са5І:ер.ог§/) и т.д.), а также 
методов сіаіа тіпіп§ (методы распознавания образов по прецедентам - метод случайного леса, 
использованный в [СаиІІюіз М. \Л/., ОІІупук А. О., Маг А., еі аі. ѴѴеЬ-ЬазесІ тасГііпе Іеатіп§ тосіеіз Іог 
геаНіте $сгеепіп§ оі іГіегтоеІесІгіс таіегіаіз ргорегбез // АРБ Маіегіаіз. 2016. Ѵ.4. N.5. Р.053213], 
комплекс программ распознавания, включенный в систему [Кізеіуоѵа N. Оисіагеѵ V. А., 
Біоіуагепко А. V. Іп1:е§га1:есі Бузіегл оі сІаІаЬазез оп іГіе ргорегбез оі" іпог§апіс зиЬзІапсез апсі таіегіаіз 
// НІ§Гі Тетрегаіиге. 2016. V. 54. № 2. Р.215-222], и т.д. Данные расчетов в дальнейшем помещаются 
в соответствующие БД с расчетной информацией. 







Близкая по назначению задача, целью которой является энергосбержение, решается при 
использовании широкозонных полупроводников (ШП), которые позволили заменить обычные 
лампы накаливания на светодиодные источники света, что стало одним из прорывных достижений 
в развитии энергосберегающих технологий. Основными характеристиками ШП является ширина 
запрещенной зоны, интервал рабочих температур (БД Вапс)§ар, 5ргіп§егМа1:егіаІ5, №М 
( уѵѵуѵѵ.іоДе.ги/5ѴА/М5М/) . СІМРА5 ( ЫТрзѴ/сіпсІаБСІаІа.сот/ )). подвижность носителей тока (БД М5М), 
температура плавления (БД М5М, Фазы и Диаграммы в (Кізеіуоѵа N. Ы., Рисіагеѵ V. А., Зіюіуагепко А. 
V. Іп1;е§га1;есі 5у$1;ет оі" сІаІаЬазез оп Ше ргорегбез оі" іпог§апіс $иЬ$1:апсе5 апсі таіегіаіз // Ні§1і 
ТетрегаШге. 2016. V. 54. № 2. Р.215-222), АІотѴѴогк ( Ьі1р://сгу5іДЬ.піт5.йо.Ір/іпс)ех еп.ЫтІ) , 
Термические Константы Веществ (ТКВ) (Іт1;1;р://\л/\л/\л/.сІтет.т5и.5и/с§і- 

ЬіпДкѵ.рІ?5Ііоѵѵ=ѵѵеІсоте.Іі1;тІ/\л/еІсоте.Іі1;тІ) и др.), токсичность, механические свойства (БД о 
последних двух свойствах, ЭКП, БД с расчетной информацией, в которых следует проводить поиск 
расчетных данных, а также список инструментария для проведения расчетов приведен выше). 

НХМ 2. Кристаллы с особыми пьезоэлектрическими, электрооптическими и 
нелинейнооптическими свойствами 

Кристаллы с особыми пьезоэлектрическими (ПЭ), электрооптическими (ЭО) и 
нелинейнооптическими (НО) свойствами широко используются в современной оптоэлектронике и 
лазерной технике в качестве рабочих тел оптических модуляторов, затворов, фильтров, приборов 
УВИ, умножителей частоты и других преобразователей параметров светового пучка (в особенности 
лазерного излучения) и т.д. Особенностью этих кристаллов является отсутствие центра симметрии. 
Следует отметить, что это условие не является достаточным для проявления ПЭ, ЭО и НО эффектов, 
однако поиск и прогнозирование еще не полученных неорганических веществ с ацентричной 
кристаллической решеткой позволяют резко сократить затраты на разработку новых ПЭ, ЭО и НО 
материалов. 

Для поиска экспериментальной информации об ацентричных кристаллах обычно 
используют базы кристаллографических данных: в большинстве случаев І5СР 

( Ьі1р://ѵуѵѵ\/ѵ.пІ5і.йоѵ/5Гс]/пІ5і84.с1тп) , а также 5ргіп§егМа1егіаІ5, АІогпѴѴогк, Фазы, Кристалл и т.д. 
Если нужная экспериментальная информация не найдена, то применение методов распознавания 
образов по прецедентам позволяет успешно прогнозировать еще не полученные соединения с 
ацентричной кристаллической структурой. 

Климатология 

К1. Обработка и анализ многомерных пространственных данных по климату 

Для климатической тематики Европейским центром среднесрочных прогнозов погоды 
ЕСМѴѴР создаются веб сервисы для доступа к климатическим данным, их использования, анализа 
и визуализации ( б11р://уѵѵуѵѵ.еаг1ІТ5егѵег.еи/5егѵісе5/с5СІ5 ). Помимо этого, ЕСМѴѴР отвечает за 
развитие климатических сервисов в климатическом блоке Сорегпісиз сіітаіе сІіап§е зегѵісе (С35, 
Ь«р5://сІіта1:е.сорегпіси5.еи/аЬои1:-с35 ) Европейской программы спутникового зондирования 
Земли Сорегпісиз (ЬМр://\л/\л/ѵѵ.сорегпіси$.еи/). Сервис С35 будет комбинировать спутниковые 
наблюдения и результаты моделирования для получения детальной информации о 
пространственных характеристиках климата прошлого, настоящего и будущего. Такой подход даст 
полное согласованное и надежное описание климата и тех его характеристик, которые важны для 
разработки мер по адаптации секторов экономики к происходящим климатическим изменениям. 

Цепочку возможного использования такого ресурса можно описать следующим образом. 
Для весенней оценки возможного урожая с конкретного поля с помощью тематических веб- 







сервисов готовится климатический анализ нормы и экстремалей для этой территории. При 
необходимости запускается метеорологическая модель и выполняется масштабирование 
метеохарактеристик реанализа ЕВА5 Шр://сІіта1:е.соретіси5.еи/с1іта1:е-геапаІѵ5І5 с 
пространственным разрешением 31 км до необходимого пространственного разрешения. 
Запускается вычислительная модель урожайности конкретной культуры, в которой используются 
средние и экстремальные метеохарактеристики. Получаемые в результате оценки ожидаемой 
урожайности для различных культур дадут возможность принять обоснованное решение об 
оптимальном использовании конкретного поля. 

К2. Изучение конкретной реакции наземных экосистем на различные типы 
климатических экстремальных явлений 

Веб-ГИС «Климат» ( Ьі1р://сІіта1е.сІіта1:е.5сег1.ги/) обеспечивает поддержку 
междисциплинарных исследований изменений регионального климата и отклика окружающей 
среды на них. В частности, для изучения конкретной реакции наземных экосистем на различные 
типы климатических экстремальных явлений волны жары, холодные периоды, сильные дожди или 
снегопады, штормы, наводнения или засухи), которые оказывают сильное воздействие на 
наземные экосистемы. Чтобы продемонстрировать, как лицо, принимающее решение, может 
использовать эту систему, предлагается следующий сценарий в области наук о Земле, который, по 
нашему мнению, может быть реализован в 2020 г. Сначала выполняется детальное изучение 
пространственно-временной динамики недавних климатических экстремальных явлений на 
территории Северной Евразии на основе доступных данных метеорологических (данные ВНИИГМИ- 
МЦД, Ы:1:р://теІео.ги/) и спутниковых (Е5А Зепііпеі, Ы:1:р5://$еп1:іпеІ5.соретіси$.еіі/) наблюдений и 
результатов реанализов (ЕСМѴѴР ЕКА5, Ьир5://с1іта1е.сорегпіси5.еи/с1іта1:е-геапаІѵ5І5#ЕаЫе ) и 
климатического моделирования (СМІР6) Анализируются статистические и динамические аспекты 
различных климатических характеристик и строится статистическая модель, описывающая 
взаимоотношения между климатическими экстремальными явлениями и экстремальными 
откликами экосистем на территории Северной Евразии. Результаты исследования динамики 
экстремальных явлений, полученные с помощью данных наблюдений, сравниваются с 
результатами, полученными с помощью региональных климатических моделей эксперимента 
СОВОЕХ (М;1;р://ѵѵ\л/\л/.согсІех.ог§/), моделями ѴѴВР (Ы;1;р://\л/\л/\л/.ѵѵг1 : -тосіеІ.ог§/) и ИВМ РАРН СМ6, а 
также в проекте СМІР6 (Іт1;1;р5://\л/\л/\л/.\л/сгр-сІіта1;е.ог§/\л/§ст-стір/\л/§ст-стір6). Полученные 
результаты используются для создания входных данных для моделей динамики растительности 
(ЕР-ІтЬ и .І5ВАСН). Полученные поля растительности детально оцениваются с точки зрения 
прогнозируемых экстремальных климатических и экосистемных явлений. В результате получается 
набор карт экосистемных рисков и уязвимостей для различных типов экстремальных 
климатических явлений на территории Северной Евразии (включая оценки периодов возврата для 
определенных бедствий и оценки неопределенности для различных типов экстремальныхявлений) 
и возможный в будущем ущерб от них. Эти карты используются лицами, принимающими решения 
для управления природными ресурсами и сельским хозяйством. Карты представляются на веб¬ 
сайте в виде слоя для ГИС, что облегчает их использование заинтересованными потребителями. 

11. Заключение 

Анализ развития в мире е-инфраструктур обеспечения совместного доступа к данным в 
распределенной мультидисциплинарной среде исследовательских инфраструктур как 
необходимых средств поддержки Открытой науки показал следующее. 

Евросоюз, следуя политике интеграции государств Европы, предпринимает естественные 
для подобной политики активные и целенаправленные действия по созданию и развитию средств 





поддержки Открытой науки, преодолевая межгосударственные границы и барьеры. Согласно 
проведенному анализу, опыт таких консорциумов как, например, ЕСI, ЕІЮАТ, заявки на новые 
проекты образуют нужные предпосылки для создания Европейского облака открытой науки (Е05С). 
Прошедшие годы активного обсуждения проекта Е05С показали, что накопленный технический 
опыт достаточен для того, чтобы принять решение и запустить проект с тем, чтобы в 2020 году 
можно было привести в действие первую реализацию Е05С. Поэтому объявление Еврокомиссией в 
конце Октября 2017 г. программы реализации Е05С представляется своевременным и 
обоснованным. 

Следует заметить, что накопленный опыт создания и использования инфраструктур данных 
и облачных архитектур в различных научных проектах Европы позволит распространить этот опыт 
на сферу экономики, основанной на данных и знаниях, что составляет важную проблему для 
развития Евросоюза. Иными словами, создание Е05С важно не только для науки, но и для 
экономики в целом. 

Вместе с тем, видны неизведанные еще проблемы. Прежде всего, это вопросы семантики 
данных в мультидисциплинарной среде. Представляется, что решение следовать принципам РАІВ 
правильное, однако, пока опыт реализации таких принципов на базе рекомендаций 
Семантического Веба, и, главное, опыт широкомасштабного внедрения такой реализации в 
практику (очень непростой для использования специалистами различных ОИИД) отсутствует. В ряде 
инфраструктур Европейской науки начаты исследования по расширению ЕІЮАТ поддержкой 
принципов РАІК для обеспечения семантической интероперабельности частей решения 
междисциплинарных задач. Первые результаты ожидаются к 2018 году. 

Проект N05, реализуемый в США, сточки зрения требований к совместному использованию 
разнообразных мультидисициплинарных данных близок к ЕОБС. Однако, пока не ясно, будут ли в 
проекте радикально решены проблемы семантики данных. Насколько известно, имеющийся в США 
практический опыт согласования семантики мультидисициплинарных данных ограничен 
средствами системы СІМЕВОІ проекта ЕагШСиЬе. В целом, проект N05 развивается прагматически 
быстро, так что можно ожидать первых результатов до 2020 года. 

Важную часть обзора составляют примеры (изе сазез) постановок задач в областях 
астрономии, материаловедения, климатологии, требующих совместного использования данных, 
имеющихся, а также ожидаемых после 2020 г. в мире и в России. Эти примеры нужны для 
взаимодействия с Европейскими проектами (прежде всего, с ЕОБС). Например, очевидным 
представляется предложение по исследованию возможности спецификации этих изе сазез согласно 
принципам РАІК для оценки идей реализации таких принципов, вырабатываемых для обеспечения 
семантической интероперабельности в различных инфраструктурах данных. 

Программа создания ЕОБС, объявленная Еврокомиссией, потребует серьезных усилий 
сообществ различных мультидисциплинарных специалистов Открытой Науки в Европе. Судя по 
замыслу ЕОБС, успех этой программы позволил бы в основном решить технические проблемы 
обозначенных в [1] глобальных тенденций создания массивных коллекций данных в мире и 
обеспечения возможности совместного использования таких коллекций при решении задач 
исследования и принятия решений в различных ОИИД в России. Вместе с тем, большое число 
трудно решаемых организационных и правовых вопросов останутся открытыми. 
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